大模型之家2025年4月热力榜:MCP备受青睐,推动AI能力边界扩展

500

2025年4月,人工智能领域迎来一场关于大模型能力边界的“范式革命”——以模型上下文协议(MCP)为核心的生态布局加速落地,成为推动大模型从“对话问答”迈向“任务执行”的关键转折点。

MCP协议通过标准化接口实现大模型与外部工具的“即插即用”,被业界喻为“AI界的USB-C接口”。通过统一接口标准,打破数据孤岛,让大模型与外部工具、数据源的协作效率实现质的飞跃,掀起了一场“AI能力边界扩展”的热潮。

MCP的兴起不仅降低了大模型应用开发门槛,更标志着AI从“单点能力秀场”走向“真实世界任务执行者”的跨越。值得关注的是,MCP的开放生态正在快速扩展,探索AI能力的规模化落地,这场由协议驱动的变革,正在重塑医疗、电商、出行等行业的智能化进程,也为大模型的商业价值释放打开了全新想象空间。

在《2025年4月大模型热力榜》中,共收录了256家大型模型及其所属企业。其中百度、阿里、字节跳动、360等头部科技企业,纷纷推出了MCP能力的模型产品。百度率先将核心地图API兼容MCP,用户通过智能体调用百度地图MCP Server可实现误差精确到秒的导航服务;阿里云百炼平台上线全生命周期MCP服务,集成通义千问、DeepSeek等模型,并打通支付宝、高德地图形成商业闭环;字节跳动内测的“扣子空间”则通过MCP整合飞书、图像工具等组件,探索跨场景服务组合。

这场由MCP引发的技术平权运动,正推动AI从“参数竞赛”转向“场景落地”。百度Create大会发布的“MCP Store”聚合开发者工具,腾讯云“AI开发套件”实现5分钟构建业务型Agent,360“MCP万能工具箱”整合110余款工具覆盖金融分析、新闻创作等场景——这些实践印证了MCP“一次开发、全生态通用”的价值。

阿里云专家透露,其百炼平台上线首周即有万名开发者接入, MCP生态已催生全新商业模式:支付宝推出国内首个“支付MCP Server”,使交易闭环在智能体内直接完成;百度地图通过MCP协议成为AI导航中枢,日均处理超千万次路径规划请求。

500

4月25日,Create 2025百度AI开发者大会召开,会上百度发布的文心大模型4.5 Turbo与X1 Turbo实现性能与成本的双重突破,较前代分别下降80%和50%,仅为行业竞品的25%-40%。这两款模型支持文本、图像、视频跨模态处理。同时,百度还发布了全球首个电商交易MCP、搜索MCP等MCP server,供开发者调用。此外,百度海宣布点亮国内首个全自研的三万卡集群,可同时承载多个千亿参数大模型的全量训练,支持1000个客户同时做百亿参数的大模型精调。据了解,该集群建设了超大规模的高性能网络,能够保证大规模集群执行训练任务时的稳定性,创新性地设计了显著降低能耗的散热方案。

4月29日,阿里云发布了新版Qwen3系列模型,并全部开源了包括2个MoE模型和6个dense模型在内的8款「混合推理模型」,参数量从0.6B到235B不等。其中,旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了与DeepSeek-R1、Grok-3和Gemini-2.5-Pro等顶级模型有竞争力的结果,支持原生 MCP 协议调用工具,开发者可配置自定义工具链实现端到端任务闭环,并在数学、代码和逻辑推理评测中达到同规模业界SOTA水平。此前,Qwen3系列已在ModelScope社区短暂上线,包含四款型号,均采用Apache License 2.0开源协议。目前,个人用户可通过通义APP即刻体验,夸克平台也将接入Qwen3。

4月10日,商汤科技重磅发布“日日新 SenseNova V6”大模型体系,通过200B高质量多模态长思维链数据(最长64K)与强化学习引擎,实现多模态推理能力国内第一,数据分析能力大幅领先GPT-4o,该模型支持10分钟长视频全帧率解析,可同步处理视觉、听觉、语言等多模态信息。技术突破的同时,商汤通过SenseCore 2.0 大装置实现多模态训练效率与纯语言模型对齐,推理成本降至业界最低。生态赋能方面,商汤启动1亿元代金券计划,面向具身智能、AIGC 等领域提供全流程AI服务支持,降低企业智能化转型门槛。

在行业应用方面,商汤与东风汽车深化合作,推出基于 VLAR 架构的生成式智驾 R-UniAD 方案,计划2025年第四季度实现端到端自动驾驶系统量产。教育领域,商汤与编程猫达成战略合作,开发多模态AI课程,通过动态学情画像实现精准施教,重塑教育资源开发流程。此外,商汤在香港政务与金融领域中标生成式 AI 合同,基于粤语的法律资讯大模型计划 100 天内交付初测版本,推动 AI 技术在港澳地区的本土化落地。

4月14日,智谱正式启动A股上市辅导备案,成为国内“大模型六小虎”中首家进入 IPO 进程的企业,计划2026年登陆资本市场,此举标志着中国AI大模型行业从技术竞赛转向商业验证的新阶段。同日,智谱发布GLM-4-32B-0414系列开源模型,包含320亿参数的基座、推理及沉思模型,其中推理模型 GLM-Z1-Air-0414实测推理速度达200 Tokens/s,性能对标DeepSeek-R1,但成本仅为其1/30,且支持本地部署与MIT协议商用,显著降低企业智能化转型门槛。其沉思模型 GLM-Z1-Rumination创新性地结合实时搜索、工具调用与自我验证,在金融研报生成等复杂任务中展现“边想边干”能力,推动AI Agent从“建议者”向“实践者”跨越。

4月23日,360旗下纳米AI推出“MCP万能工具箱”,整合110余款工具,覆盖办公协作、金融分析、医疗诊断等场景,用户可一键调用多模型能力(如DeepSeek-R1、阿里通义千问)生成专业报告或智能体,效率较传统模式提升300%,同时通过安全检测与数据加密构建全链路防护体系。在行业标准层面,4月3日,360深度参与制定的三项人工智能大模型国家标准(《通用要求》《评测指标与方法》《服务能力成熟度评估》)正式发布,推动大模型在政务、交通等20余个行业的合规落地,并提出“以模制模” 的理念,通过安全大模型实现从基座模型到智能体的全流程安全治理。

在生态合作方面,360与贵州移动共建算力基础设施,推动中小企业数字化转型;与重庆轨道集团成立AI大模型实验室,攻克山地轨道交通智能化难题;奇富科技(360生态企业)则联合广东华兴银行、广州联通探索“AI+金融” 应用,推出AI营销助手、审批官等智能体,提升风控与决策效率。

4月17日,字节跳动在火山引擎FORCE LINK AI创新巡展上正式发布豆包1.5深度思考模型,同时,字节跳动Seed团队推出VAPO强化学习框架,通过价值预训练、自适应序列优化等创新技术,解决了长序列任务中奖励稀疏、探索效率低等核心难题。此外,字节跳动推出AI智能体开发平台“扣子空间”,支持用户通过自然语言生成网页、PPT等文档,其独创的探索模式与规划模式双轨机制,可满足轻量级任务与复杂场景的不同需求,并通过MCP协议拓展生态边界,其扣子空间平台集成MCP扩展体系,内测首期已支持飞书多维表格、高德地图等高频办公组件接入,未来支持开发者通过扣子开发平台发布自定义插件,持续拓展Agent能力边界。

4月,腾讯宣布对混元大模型研发体系进行全面重构,成立大语言模型部与多模态模型部,整合AI Lab、安全平台部等团队资源,形成“双核驱动”架构,目标覆盖智能客服、内容生成等场景。技术投入持续加码,2024年腾讯AI研发投入达707亿元,累计超3403亿元,2025年计划资本支出占收入低两位数百分比。产品层面,腾讯推出快思考模型TurboS、深度思考模型T1,并开源3D生成、视频生成等模型,GitHub总Star数超2.9万。行业应用方面,腾讯云企业级知识库产品已落地金融、能源、医疗等八大行业,助力比亚迪、大参林等头部企业实现智能化升级。

DeepSeek于4月30日正式开源了DeepSeek-Prover-V2-671B模型,专注数学定理证明任务,参数规模达6710亿,结合Lean 4框架与强化学习,在miniF2F测试中通过率达88.9%,远超竞品表现。

4月22日,生数科技正式上线全新视频大模型Vidu Q1。根据VBench系列测评结果显示,Vidu Q1在视频质量、语义一致性以及常识推理和物理理解等多个维度上均达到行业领先水平,得分超过Runway、Sora、Kling等国内外知名模型。

4月8日,阶跃星辰正式发布了全新的多模态推理模型——Step-R1-V-Mini。该模型支持图文输入和文字输出,并具备良好的指令遵循能力和通用性,能够高精度感知图像并完成复杂推理任务。27日,阶跃星辰再宣布开源图像编辑大模型Step1X-Edit,该模型参数总量达19B,具备语义精准解析和多项高精度控制能力,支持11类常见图像编辑任务。

站务

全部专栏