媒体实测美团自研模型与百度梯子AI产品,后者竟可调用追剧网站

9月5日,《科创板日报》发布了一项AI产品测评报道。在该报告中,其对美团和百度的AI产品进行评测时,使用DeepSeek金策测评以进行同期性能对比。

美团发布并开源了5600亿参数混合专家模型LongCat,目前通过官方网站向用户提供免费服务,支持简体中文与英文界面。据介绍,该模型在30天内完成超过20万亿token的预训练,推理速度可达每秒100 token,成本低至每百万输出token 0.7美元。实测结果显示,在解决数学题“1/2x=2/(x-3)”时,LongCat用时约5秒输出答案,响应快于DeepSeek的18秒。在文学创作任务中,LongCat也表现出更贴近鲁迅文风的生成效果。

500

百度则推出了更名后的AI搜索产品“梯子AI”,其定位为智能搜索工具,提供自动思考与深度思考双模式。测试显示,“梯子AI”不仅解答了同一数学题,还调用全网搜索,并在每个步骤中附带参考资料,同时生成相似题目辅助学习。该产品还提供追剧板块和延伸资讯服务,但其“免费追剧网站”功能可能涉及版权风险。

500

据悉,美团在财报中披露了其研发投入情况。根据2025年第二季度及半年业绩报告,二季度美团研发投入63亿元,同比增长17.2%,研发费用率稳定在6.8%,去年年全年研发投入达211亿元。

而2025年第二季度百度研发投入为51亿元,同比下降13%,但AI相关投入占比显著。第一季度研发费用为45.44亿元,同比减少15%。2024年全年研发费用为221亿元,同比减少9%。 此外,百度十年累计研发投入超1800亿元,2024年AI研发占比达19.44%。

站务

全部专栏