落选“果链”,别再捧杀DeepSeek了
是对手也是队友
撰文/ 陈邓新
编辑/ 李觐麟
排版/ Annalee
DeepSeek,持续正反馈AI赛道。
2025年2月13日,文心一言宣布将于4月1日0时起全面免费,所有PC端和APP端用户均可体验文心系列最新模型,而此前只有免费使用3.5版。
随之而来的,则是舆论此起彼伏。
在苹果不选择DeepSeek作为“AI搭子”时,The Information报道,苹果考虑了多个国内的对象,与阿里巴巴的合作已取得重大进展,并明确拒绝了DeepSeek。
这意味着,DeepSeek落选了苹果供应链,令人唏嘘不已。
其实,BAT们与DeepSeek并非“针尖对麦芒”。
文小言、腾讯元宝等接入DeepSeek大模型,为用户提供更多的AI选择;阿里云、腾讯云、华为云、京东云、火山引擎、百度智能云等主流云服务平台纷纷上线DeepSeek大模型,鼓励用户尝鲜DeepSeek-R1、DeepSeek-V3……
BAT们与DeepSeek,是对手也是队友?
没有拔刀相向,反而雪中送炭
DeepSeek的初衷,是印证“条条大路通罗马”。
生成式AI革命爆发之后,大模型站上了“风口”,而算力成为衡量大模型能力的核心指标之一,在力大飞砖的简单思维之下,硅谷将算力塑造为“皇冠上的明珠”,被视为难以企及的力量。
于是乎,算力紧张成为行业的关键词,令AI成本长期居高不下。
此背景下,DeepSeek通过算法优化等手段降低了AI成本,用最少的资源达到最大的效果,为行业花小钱办大事提供了新的思路和方向。
图源:DeepSeek官网
这意味着,扩大算力并非AI进化的唯一途径。
斯坦福大学人工智能实验室主任吴恩达:“近年来,围绕‘扩大模型规模能够推动AI进步’的观点备受追捧。事实上,我曾是这一理念的早期支持者。”
不难看出,消解算力壁垒才是DeepSeek的真正影响。
巧的是,这也是全球互联网巨头共同的夙愿:唯有不断降低成本,AI普惠才可以从梦想照进现实,从而颠覆传统的产业格局与商业模式。
更为重要的是,可以错位竞争。
DeepSeek创始人梁文锋表示:“长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其他公司在DeepSeek 的基础上构建To B、To C的业务。”
关于此,从BAT们的态度就可见一斑。
QuestMobile的数据显示,DeepSeek的日活跃用户数已突破3000万大关,创造了史上最快达成这一成就的新纪录。
随之而来的则是,“服务器繁忙,请稍后再试”屡屡被用户诟病。
屡屡被用户诟病
腾讯云、阿里云、京东云、华为云、火山引擎、百度智能云等纷纷伸出援手,满足外界对DeepSeek不断增长的推理需求。
譬如,京东云上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。
再譬如,腾讯云支持开发者将“满血版”DeepSeek 接入微信小程序,可实现智能对话、文本生成等功能。
天使投资人、资深人工智能专家郭涛认为DeepSeek不会冲击行业原有的竞争格局:“文心一言、通义千问等AI大模型都已建立起完善的生态体系,且背后有百度、阿里巴巴等强大企业的支持,技术实力雄厚,能够持续投入研发进行技术迭代升级。”
AI创新是一场马拉松而非短跑
以上可见,BAT们对DeepSeek的态度颇为友好,这背后的缘由有三。
首先,降本一直进行中。
DeepSeek之前,BAT们就在不断推动AI降低成本,也取得非常不错的成就,共同推动大模型定价进入“厘时代”。
事实上,BAT们的创新也可圈可点。
譬如,字节跳动设计了一个全新的稀疏模型架构UltraMem,有效解决了传统主流MoE架构存在的推理时高额访存问题,从而提升推理速度2倍至6倍,推理成本最高可降低83%。
上述架构创新,与DeepSeek有异曲同工之妙。
再譬如,百度点亮国内首个自研万卡集群,有效解决了过去算力价格高以及无法稳定应用的问题,通过集群效能最大化达到降低单位算力成本的目的。
“今天,创新速度比以往都快得多。摩尔定律中,每18个月,性能就会翻倍,价格减半;如今,大模型推理成本每年能降低90%以上。”李彦宏称。
图源:AI产品榜
其次,模型蒸馏成为竞争新高地。
模型蒸馏成为获取低成本AI的重要路径,进一步降低了大模型的门槛,为AI落地走进千家万户提供了更多的可能。
李飞飞团队训练出的s1人工智能推理模型,就是其中的代表。
s1人工智能推理模型以阿里巴巴通义千问为基座模型进行微调,蒸馏了谷歌推理模型Gemini 2.0 Flash Thinking Experimental的1000个样本,在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似,耗费不到50美元。
换而言之,模型蒸馏为行业指明一个新的前进方向。
德邦证券的研究表明,2025年将是模型蒸馏技术的爆发年,AI应用的成本有望大幅下降,模型能力也将全面提升;通过引导和支持,AI模型不仅能够在云端获取巨大的优势,也能在边缘计算等端侧应用中发挥重要作用。
如此一来,BAT们有了更大的发力空间,没有与DeepSeek较劲的必要。
中国首席经济学家论坛理事刘煜辉表示:“现实世界可以用来训练AI模型的数据资料已经耗尽,现在大家都是相互借鉴数据相互蒸馏,大家的模型水平根本拉不开差距,拼的就是谁能够找到新的应用场景、谁能率先把价格打下来。”
再次,不排除结下善缘的可能。
种种迹象表明,DeepSeek虽然初期拒绝了融资,但随着规模不断扩大,资源瓶颈问题肉眼可见,成为一个棘手的问题。
一名私募人士告诉锌刻度:“DeepSeek背靠的幻方量化虽然是千亿元体量,但客户的钱不等于幻方的钱,更不等于可以投入的钱,迟早需要寻找外援。”
实际上,量化并不能长时间“躺赢”。
幻方量化CEO陆政哲曾坦言:“迅速崛起、规模快速放大、又飞快衰落消失,这仿佛是量化行业的死循环,像悬在我们头上的达摩克利斯之剑。”
从这个角度来看,BAT们可以在算力、数据、场景等全方位助力DeepSeek,大家各取所需实现双赢。
实际上,BAT们一直青睐富有特色的AI初创企业,被誉为“AI六小龙”的智谱AI、月之暗面、百川智能、零一万物、阶跃星辰、MiniMax,背后不乏腾讯、小米、美团、阿里巴巴等身影。
总而言之,AI创新是一场马拉松而非短跑,比拼的是耐力与毅力,无论BAT们这样的头部选手,还是DeepSeek这样的初创企业,都有弯道超车的机会,相互借力与借鉴才可以共同提高,大家都有美好的未来。
那么,神话DeepSeek大可不必。