马斯克怒批DeepSeek,质疑R1模型训练成本造假,美AI厂商破防了?

国产AI模型DeepSeek-R1发布之后,在全球范围内引起轰动,尤其是美国AI厂商集体破防了。他们先是惊叹于DeepSeek(深度求索)的精彩表现,对其在训练成本、测试表现等多个指标超越美国OpenAI最新模型感到震撼,紧接着就开始污蔑其抄袭,甚至质疑其数据造假。

500

这种超廉价的AI模型横空出世,直接打破了美国AI芯片禁令的霸权。因为它采用了低端芯片用不到600万美元的成本,达到了OpenAI耗费10亿美元的水平,甚至一度在下载量上超过了ChatGPT,让美科技股连带下跌。

美国以为,他们禁止中国获得高端AI芯片,中国的AI将永远落后于美国。但是他们没想到深度求索实现了弯道超车。

500

今年40岁深度求索创始人梁文锋不仅全栈自研解决了AI发展的瓶颈,还选择了将成果开源。

深度求索掌握了利用更高效内存和学习策略,来降低模型训练成本的方法,它的模型生成信息的成本仅为OpenAI的ChatGPT模型的十分之一。据估计,西方主要AI模型使用了1万6000个专用芯片,深度求索只使用了约2048块英伟达H800芯片,根本不依赖于芯片的先进与否。

500

多个参数量现实,深度求索让原本遥遥领先的美国AI企业深感危机重重。当被问及是怎么做到的时候,梁文锋说:“没有什么高深莫测的奇才”,都是没多少经验的年轻人。他认为,“创新需要摆脱惯性,经验有时会成为包袱”。

什么概念呢,不需要高成本,不需要高算力芯片,不需要外国的工程师,一群年轻的中国AI学者,就已经让美国的AI霸权彻底终结。

500

于是,深度求索遭遇了美国IP的攻击,奇安信称攻击烈度不断升级,在大年初一时达到了顶点,目前还在继续扩大。针对深度求索的网络攻击一直在层层加码,攻击手段越来越多,防范难度越来越大,使得其面临的安全考验愈发严峻。

美国商务部长提名人选卢特尼克则毫无依据地表示“深度求索盗取美国技术,更誓言要对中国征收最高关税”。特朗普团队准备进一步收紧英伟达对华销售限制。

500

沉默了几天的AI领域大佬马斯克也开始发声,质疑深度求索的R1模型训练成本造假。实际上他真的破防了。

先是美国的5000亿AI基建项目没有他的份,后是中国的深度求索仅仅使用577万美元就训练出来媲美他的sota模型。这让他刚刚融资120亿美元,估值400亿美元的sota饱受质疑。

500

马斯克认为深度求索使用了50000张英伟达 H100训练模型,是因为他旗下的Grok3正在孟菲斯数据中心依托10万块H100芯片进行训练,作为“省钱小能手”的马斯克实在是想象不出深度求索可以比他更省钱:DeepSeek-V3的训练则只使用了2048颗英伟达H800。

可以说,美国的AI行业都还是慌了,正如当年我们使用算盘替代计算机去计算原子弹理论数据一样,他们确实无法想象中国AI创新能力的天花板。现在美国想要扼杀包括深度求索模型在内的多个国产模型的竞争力,但是其实已经无能为力了。

500

如果说深度求索是在线上打败了美国的AI霸权,那么春晚舞台上扭秧歌的人形机器人是在线下突破了美国的科技幻想。科技本来就是为人类服务的,本来应该无国界的。

只不过,他们曾经无数次地标榜,又无数次地打压其他国家发展,到现在被超越的时候,就视为“对美国国家安全的威胁”,这种玩不起就翻脸的方式注定了其大败局的提前到来。

站务

全部专栏