中国AI初创公司DeepSeek正在干废OpenAI,美帝“倒霉催的”加速度
中国AI初创公司DeepSeek正在干废OpenAI,美帝“倒霉催的”加速度|第1788期
在2024年圣诞节的第二天,一家名为DeepSeek的中国小型初创人工智能AI公司,发布了一个新的人工智能系统,经验证,DeepSeek的功能完全可以跟OpenAI和谷歌等美国顶尖科技公司的尖端聊天机器人相媲美。
美国人一下子傻了,当然,中国国内这两年以来以鼓吹美国OpenAI公司“寿与天齐仙福永享”的所谓中国专家们好像也傻掉了。
现在,我看在西方媒体的中文页面上,在介绍DeepSeek时,都会说它是中国的深度探索公司,然后再加个(DeepSeek)——这就深刻表现了美国人对中国文化全球化方面的进步根本不了解,其实在中国,根本没有人称DeepSeek为深度探索,而是直接称为DeepSeek,这几个英文在中国人人听得懂,记得住。
而更令美国媒体惊奇的是,现在这个名为DeepSeek-V3的大模型的背后团队描述了一个更恐怖事实,就是DeepSeek的工程师在介绍他们如何构建这个大模型的论文中说,他们训练该系统只用了领先的美国人工智能公司用所使的高度专业化AI芯片的一小部分,就足够了——而且还真是被英伟达黄仁勋“阉割”过的芯片。
而AI芯片正是中美两国间最激烈科技战的最核心要件。
美国之前的拜登政府一直想保持住本国在全球人工智能竞争中的领先,就试图对能够出售给中国企业的高性能芯片,比如英伟达公司的高端人工智能芯片进行限制,而且还真限制住了,所以英伟达现在只能卖给中国“阉割”过的芯片,估计台湾人黄仁勋做梦也想不到,即使自己已经如此鸡贼,他还是帮了DeepSeek。
现在DeepSeek大模型的表现已经让美国人自己对政府的贸易限制产生的意外后果产生了质疑,因为美国的出口管制措施正迫使中国的研究人员使用互联网上免费提供的各种工具来发挥创造力,估计美国人从来没听说有中国有一句成语:道高一尺,魔高一丈。
根据美国人工智能公司一直使用的行业基准测试,DeepSeek的聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,能力并不亚于市场上已有的任何AI产品。
而且更致命的是,DeepSeek的聊天机器人的造价极低,这挑战了只有最 有钱的科技巨头才能制造出人类最先进人工智能系统的那种硅谷普识观念。DeepSeek的工程师仅仅花了约640万美元,就训练出了一个成功的新模型,成本还不到马克·扎克伯格的Meta公司训练最新人工智能大模型所耗费资金的十分之一。
这还了得?!
这对美国人来说意味着不但他们对人工智能芯片的垄断封锁眼看就失败了,而且,本来正在涌向硅谷,而且看似只能涌向硅谷的大量资本估计很快会涌进中国,中国人过往总说什么叫“白菜价”,现在其实高昂的人工智能大模型技术也正在被中国人搞成了白菜价。
自从OpenAI公司在两年多以前的2022年发布了ChatGPT,引发了人工智能产业热潮以来,许多专家和投资者都得出结论:如果不投入数亿甚至是数十亿美元购买美国最高端的人工智能专用芯片,不会有科技公司能与这个行业的领军者竞争。
世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机最多需要多达1.6万个高端专用芯片,甚至更多,但DeepSeek的中国工程师们只用了大约2000个英伟达的专用芯片。
这还了得?!
出现在中国总理召集的座谈会上的DeepSeek创始人梁文锋
而最可怕的场景在于,在1月20日,中国国务院总理李强主持召开了一个专家、企业家的座谈会,听取对今年《政府工作报告(征求意见稿)》的意见建议,在这场座谈会上,DeepSeek的创始人梁文锋也参会了,还发了言,也就是说,DeepSeek在人工智能上建立起来的优势在中国——这就“上达天庭”了。
还是那句话:这还了得?!
今年1月初,拜登老而不死死而不僵,临下台前还颁布了一个专门针对中国,旨在阻止中国通过他国途径获取美国先进人工智能芯片的新规则,是又狠又准,而在这个新规则之前,美国已采取了多轮的限制措施,阻止中国公司购买或制造出尖端计算机的芯片,现在,特朗普上台了,一时还看不出来,他是否会继续实施或取消这些措施。
不过,现在Meta的创始人马克·扎克伯格已经说了:DeepSeek模型非常先进,不过我们应该希望美国的模型能赢,因为这是一场巨大的地缘政治竞争,而中国正在全力冲刺。我们当然该支持美国的公司,支持美国的标准获胜。
很明显,马克·扎克伯格已经毫不掩饰地在呼吁美国政府要对DeepSeek马上进行封锁——其实TikTok在美国被制裁就是始自于扎克伯格的游说。
去年的12月,OpenAI曾经发布了一款性能超过现有技术的名为o3的新的推理模型系统,但DeepSeek公司也马上跟进,继续表明自己的技术并不落后,在这个月发布了自己的另一个推理模型DeepSeek-R1,而作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能已经完全能够比肩OpenAI o1模型的正式版。
并且还采用了MIT许可协议,支持免费商用、任意修改和衍生开发等。
目前在国外大模型排名榜上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
英伟达“阉割版”芯片却成就了DeepSeek的强大,上哪儿讲理去?
而更令市场惊讶的是,DeepSeek公司说了,R1的预训练费用只有557.6万美元,是在2048块英伟达的“阉割版”H800 GPU芯片集群上运行了55天完成的,仅为GPT-4o模型训练成本的不到十分之一。
DeepSeek不仅将R1训练技术全部公开,还“蒸馏”出6个小模型向社区开源,允许用户借此训练其他模型。在API定价方面,DeepSeek-R1服务对每百万输入代币收取0.55美元,对每百万输出代币收取2.19美元/百万,而OpenAI最新版o1模型的相应收费分别为15美元/百万和60美元/百万。
之前,许多硅谷高管和专家认为,美国大公司不应该开源技术,说它们可能被用来传播虚假信息或造成其他严重危害,一些美国的立法者也已经在探索阻止或限制开源的可能性。但是,也有人认为,如果监管机构扼杀了开源技术在美国的进步,那样中国就将获得显著优势。
因为,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建他们的系统,从更长远的眼光来看,这可能会让中国成为未来研发人工智能的中心。
现在DeepSeek崛起了,不幸就被他们言中了。
DeepSeek推出的是强大的开源模型,所以,这家体量仍然很小的人工智能公司现在让美国人非常恐惧,
以前,华为公司崛起曾经让特朗普政府非常恐惧,
后来,TikTok崛起曾经让拜登政府非常恐惧,
现在,DeepSeek崛起甚至让整个硅谷非常恐惧。
在《司马平邦说》第1768期(中美不是竞争,而是决战!胜利或失败都不可想像)里,说到现在中美之间的竞争时,我说过,其实说“中国竞争”都是错误的,因为竞争是表示也可以不竞争,说中美之间的竞争,其实也是表示中国与其他国家,或美国与其他国家也可以进行竞争——但其实呢,这些根本都不存在,中国与其他国家并不存在竞争关系,美国与其他国家也并不存在竞争关系,所以我觉得,那就不如把竞争换成决战,现在就是中美之间的决战。
竞争和决战,是有巨大区别的。
现在很多中国人还没意识到中国如果输掉这场决战,未来会是一个什么样的命运,但从现在美国对中国的根本不问理由,不在乎道义,不计成本,的打压手法来看,如果中国在这场决赛中失败了,那也将是不可想像的。
抖音的美国版TikTok因为受到美国政府的野蛮封禁,造就了1.7亿的“TikTok难民”,这些美国用户想在TikTok被封禁之后找到新的替代,他们左找右找,上穷碧落下黄泉地找,最后除了另一款中国的应用程序小红书之外,再没有其他,这其实是一个隐藏在表相之后的重要现实。
世界上并非只有两个国家,中国和美国,这个世界还有接近200个国家和地区,尤其是还有十数个所谓西方发达国家,但大家发现没发现,除中国以外,已经是没有任何国家能够为TikTok提供新的替代应用程序,除了中国就是美国,除了美国就是中国,全世界互联网应用程序的最顶尖竞争就只能集中在中美两国之间,别的国家都没有资格加入。
现在DeepSeek的崛起,道理上也是一样的,在人工智能AI上,除了美国就是中国,除了中国就是美国,这其实是继不久前发生的“TikTok难民”向小红书的转移之后,再一次证明,现在中美两国完全处于巅峰决战中。
中美两个国家,和代表中美两国的最重要实体(企业),都已经处于同一个巅峰上,但又不可能平起平坐,不可能共同繁荣,那怎么办呢?就是必须有一个要倒下下。
反正我用眼睛的余光看到了,OpenAI和Meta都快要撑不住了。