DeepSeek的爆红,指出了当下AI最大困境
回望计算机历史,DeepSeek 恰逢其时。
作者 | Moonshot
编辑 | 靖宇
近期,「横空出世」的 DeepSeek 是中国春节前的意外之喜,也震荡了大洋彼岸美国的应用商店、科技公司、甚至股市。
DeepSeek 在中美两区双登顶 App Store 免费榜第一;让英伟达一夜股价狂跌近 17%,市值蒸发 5890 亿美元,直接创下华尔街有史以来单日个股暴跌价值纪录,其他人工智能衍生服务的公司股价也纷纷大跌。
Meta 员工内部爆料称,DeepSeek 让公司进入恐慌模式,连夜成立四个专门研究小组;美国总统直言:DeepSeek 是对美国 AI 行业的当头棒喝。
Sam Altman 也被卷到了|图源:X
震惊、恐慌、难堪、好奇、赞许、骄傲……由 DeepSeek 引发的复杂情绪在中美两国的科技界里蔓延着。
但 DeepSeek 只是「横空出世」吗?除了深度求索公司强大的技术力之外,它的出现是否有迹可循?意外背后是否有着一种必然?
01
AI 行业的规模化困境
微软 Windows 部门前总裁,曾带领开发出 Windows 7、Windows 8 的科技老兵 Steven Sinofsky 近日在 X 上发表长文《DeepSeek 是不可避免的,原因如下)》,从技术史的角度,看到了 AI 行业如今的窘境,和 DeepSeek 问世的必然。
图源:X
在 Sinofsky 看来,DeepSeek 的出现是技术发展的必然。
当下 AI 的发展轨迹是堆叠在资本之上,因此大型的 AI 公司要么自身是科技巨头,比如 Google、Meta,OpenAI 与微软、xAI 背靠马斯克,要么凭借业内资源完成大额融资的初创公司,像是 Perplexity 和 Anthropic。
这些公司因为坐拥更好的资源,所以在 AI 的技术探索上,一直在用扩张的思路发展,买数据、买芯片、买算力、买人……这种用资本换扩张的路径,让美国的 AI 行业现在看起来像一场大型军备竞赛。
但 Sinofsky 回望计算机发展史,他发现了一个规律:创新会带来新的产品,纵向扩展(scale up)紧随其后,即持续推动产品演进成更高、更快、更强的版本,但这种模式会被横向扩展(scale out)所颠覆,「更快更强」会被「小巧但多」所取代。
以计算设备的发展为例,纵向扩展下,电脑从占据一整个房间的 ENIAC,演进到晶体管计算器,到可以放在办公桌上的集成电路计算机、再到沿用至今的微型处理器。但性能更强的桌面电脑,普及率和数量都不如横向扩展后的智能手机。
现代计算机演变史|图源:VOIDSTAR
带入到 AI,Sinofsky 认为过去五年的 AI 公司的发展思路就是纵向扩展:更大的模型、更多的参数、更强的计算能力。这是他们的先发优势,但也让他们陷入了大公司的惯性里,一直在做性能提升,而没有质的飞跃。
这也被 Sinofsky 称之为「规模化的困境」,在当下的 AI 行业里,尽管有许多技术进展,但代价是巨大的资本投入。训练集群的基础设施硬件,定期扫描互联网去训练数据,再到用户端调用服务,大模型的发展速度和资金的燃烧速度不相上下。
然而回望计算机发展史,技术发展的成本会逐渐下降而不是上升,AI 行业目前显然在背道而驰。
主要 AI 模型的培训成本|图源:新浪科技
02
DeepSeek 正在重塑 AI?
在技术史上,有许多「大卫与歌利亚」般的故事。当向上发展的规模化到达一定高度后,就必然会诞生做横向扩展的产品,它们重塑行业,也让巨头感到恐惧。
Sinofsky 以互联网举例,美国通讯巨头 AT&T 曾认为,构建互联网不能依靠一些「玩具型」的技术,而应该扩展电话网络,增加通讯设备,让信号更稳更强。原因很简单,他们坐拥通讯网络的基础设施。
然而真正互联网的构建,是依托于当时的小公司思科发明的路由器,蒂姆·伯纳斯-李发明的 HTTP、HTML 等协议和编码,网景开发的浏览器……这些个人和小公司当时都没有大量的资金和基础设施,但靠有限的资源构建起了互联网。
套用到 AI 行业,就是 DeepSeek。
它价少、性能强、好调用,它不依靠硬件堆砌,实现了和超大规模 AI 不相上下的推理效果,证明了大模型的发展,不是只有巨量的资本投入这一条路径。
DeepSeek 在这个意义上,摆脱了规模化的困境,创造了新的可能。也正是因为低成本,才能让它敢于开源,让更多人、更多初创公司能参与到 AI 的开发里。
就像 DeepSeek 创始人梁文锋在采访里所说「未来世界可能是一个术业有专攻的分工世界……我们认为现阶段是技术创新爆炸性增长的时期,长期来看,我们希望创造一个生态系统,让行业直接利用我们的技术和产出。拥有一个强大的技术生态系统更重要。」
人人用得起的 API|图源:DeepSeek
Marc Anderson 所称,DeepSeek R1 的发布,宛如当年太空竞赛里,苏联率先把第一颗人造卫星送上太空,这是人工智能的「斯普特尼克时刻」,也是最令人惊叹、最让人印象深刻的突破之一。
然而在 DeepSeek 团队眼里,AI 不应该是军备竞赛,它不应该限于某家公司、某个平台、某个功能,而是如同互联网一般,拥有无限潜力的技术生态。
AI 的发展也符合了科技史的某种叙事,只是此前的科技故事一直由硅谷驱动,而这一次,颠覆性的创新的主角来自中国,且新章节才开始书写。
*头图来源:icreate
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO