点亮自研万卡集群,百度AI降本蹚新路
算力平权从梦想走进现实
撰文/ 陈邓新
编辑/ 李 季
排版/ Annalee
算力=生产力,已成为全球的共识。
近日,百度智能云成功点亮昆仑芯三代万卡集群,成为国内首个正式点亮的自研万卡集群,之后将进一步点亮三万卡集群。百度智能云上线DeepSeek R1/V3模型首日,已有超1.5万家客户通过千帆平台进行模型调用。
这意味着,百度给出另外一个降低AI成本的解题思路。
即通过自研的昆仑芯三代以及万卡集群,从而牢牢掌握算力的话语权与自主权,最终取得“高效率、低成本”的重大突破,为中国AI产业向新而生、向质图强注入新动力。
毋庸置疑,百度的“护城河”更宽了。
颠覆“大力出奇迹”的粗放思维
花小钱办大事,一直是中华民族的优良传统。
公开资料显示,50多年前,中国科技界建成堪比国际水平的JF-8激波风洞,为火箭、卫星等大国重器面世立下汗马功劳,而加工费仅为8万余元。
不难看出,最少的资源可以达到最大的成果。
在AI时代,这一理念更是重要:在“大力出奇迹”的粗放思维之下,算力紧张的局面难以缓解,以至于AI成本居高不下。
而由于种种缘由,算力紧张并非一朝一夕可以解决。
此背景下,DeepSeek通过算法优化等手段降低了成本,在科技界引起轩然大波。
对此,一名业内人士告诉锌刻度:“低成本软件方案性价比高,但并不意味着对算力的需求可以忽视,特别是在多模态之下,大模型对算力的需求会呈现几何级增长,毕竟多模态模型能力持续升级是大势所趋。”
如此一来,百度对“高效率、低成本”有了更多的考量。
自研了性能更强的第三代昆仑芯,不但解决了自身算力的供应问题,还极大地抵消了算力的溢价问题。
一言以蔽之,国产自主万卡集群成功抓住过去价格高和无法稳定应用的痛点。
更为重要的是,还实现了“减价不减量”。
万卡集群带来的超大规模并行计算,可实现训练效率跃升,可将千亿参数模型的训练周期大幅降低,满足AI原生应用快速迭代的需求。同时,也能支持更大模型与复杂任务和多模态数据,支撑Sora类应用的开发。
此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数级下降。
通俗易懂地说,百度颠覆了传统的“大力出奇迹”打法,借助资源优化配置与创新思维,将“单任务算力消耗”迭代为“集群效能最大化”,在满足极致性能的同时,又达到降低单位算力成本的目的。
AI降本还得看百度
事实上,蹚出低成本硬件路线,为行业指明一个新的前进方向,非百度莫属。
一方面,始终秉持长期主义。
百度经历PC时代、移动互联网时代、人工智能时代,持之以恒地投入财力与人力倾注研发,不改技术驱动的底色。
中国工程院院士、清华大学计算机系教授郑纬民认为构建国产自主万卡集群充满挑战,但“至关重要”,“异构卡和异地卡的联合训练效果并不理想”。
昆仑芯三代万卡集群点亮,也意味着上述问题迎刃而解。
以上可见,百度成为中国AI的开拓者、布道者与领导者,在情理之中。
其实,百度是中国唯一一家拥有全栈AI技术架构的公司,在芯片层、框架层、模型层与应用层都有关键自研技术,拥有其他玩家不可比拟的优势。
《百度人工智能创新与专利白皮书2024》显示,截至2023年底,百度在人工智能全领域专利申请量19308件、授权量9260件,连续六年获得国内第一。
另外一方面,百舸AI异构计算平台全方位赋能。
国产万卡集群部署并非易事,需要克服一系列难题,在此过程中百舸AI异构计算平台4.0发挥了至关重要的作用。
首先,构建了十万卡级别的超大规模HPN高性能网络,突破了硬件扩展性瓶颈,降低了通信瓶颈,带宽有效性达到90%以上;
其次,围绕芯片及集群功耗,基于万卡规模常规方案功耗可达十兆瓦或更高,采用创新性散热方案,从而解决万卡集群的能效与散热问题;
再次,完善模型的分布式训练优化,采用高效并行化任务切分策略,训练主流开源模型的集群MFU提升至58%;
最后,提供容错与稳定性机制,避免由于单卡故障率随规模指数上升而造成的万卡集群有效性大幅下降,保障有效训练率达到98%。
不难看出,百舸AI异构计算平台4.0全方位提升国产万卡集群的实力,令百度获得领先、可持续的AI竞争力。
需要注意的是,百舸AI异构计算平台4.0早已赋能千行百业。
譬如,赋能教育行业,为好未来自研的“九章大模型”提供专业AI基础设施,单集群总量超过500TB,为训练任务的模型、数据加载提供高性能的数据读取与传输保障,从而提升用户的智能学习体验。
再譬如,赋能汽车行业,为长安汽车“星环平台”提供高性能AI底座,算力总体平均使用率提升到90%以上,促进智能驾驶、智能网联等产品与服务的开发提速,从而提升用户的智驾体验。
另外,百度智能云上架了DeepSeek,调用DeepSeek-R1对比官方刊例价为5折,调用DeepSeek-V3对比官方刊例价为3折,调用价格为全网最低,将“高效率、低成本”理念进一步贯彻,为企业用户提供更具性价比的选择。
算力平权加速AI应用繁荣
更为关键的是,百度推动算力平权从梦想走进现实。
之前,硅谷一直将算力塑造为“皇冠上的明珠”,被视为难以企及的力量。
如今,国产自主万卡集群面世,不但拥有自主可控的优势,还拥有巨大的降本潜力,助力企业灵活、稳定地支配高端算力以及消解算力壁垒。
简而言之,百度重塑了算力价值新坐标。
由此一来,“高效率、低成本”成为企业的核心竞争力,可以更低门槛地进行应用的开发与产业创新。
花旗银行最新研报指出:“DeepSeek、百度等中国模型展现出高效和低成本优势,将有助于加速全球AI应用开发,并在全球引发更多技术创新,推动2025年人工智能应用的拐点。”
这意味着,AI原生应用将迎来井喷式增长。
凭借强大的算力优势、成本效益以及百舸平台的全方位赋能,百度可以大幅缩短AI原生应用的迭代周期,以达到与时代同步、与用户同频的目的,成为最适合AI原生应用扎根的“土壤”。
百度官方数据显示,飞桨文心生态已凝聚1808万开发者,已服务43万家企事业单位,已创建101万个模型;千帆大模型平台已帮助客户精调3.3万个模型,已开放了77万企业级应用。
此外,智能体是最受青睐的AI原生应用发展方向。
百度以搜索为核心,叠加百度联盟提供的广告服务,成功构筑了一个“开发+分发+变现”的完整智能体商业闭环,实现了生态共建、利益共享、合作共赢。
截至2024年11月,文心智能体平台已吸引80万名开发者和15万家企业入驻,实现16倍分发增长。
综上所述,以人工智能为核心战略、以提升AI能力为战略重点的百度,走在算力降本的最前沿,通过国产自研万卡集群促进中国的AI原生应用繁荣,彰显了中国硬科技的实力。
那么,AI原生应用迈入“黄金时代”。