2025中国AI反击战打响,美国大公司恐慌了,人工智能牛皮注定破灭

1. AI业界真出大事了。很简单,中国开源的deepseek r1价格是0.55美元每百万输入token,输出2.19美元每百万。而openai最新的o1,收费是15和60美元,要贵20多倍。二者性能相当,数学、编程、自然语言推理得分差不多。业界已经在疯狂下载deepseek r1,技术迅速扩散,美国大公司没法回答怎么赚钱的问题,圈钱也就困难了。甚至人们怀疑,美国大公司没有什么领先的AI技术了。

2. 我一直唱衰美国的AI狂热。主要理由是现在的技术还做不出通用人工智能AGI,就如Deepmind的哈萨比斯说的,还需要两三个重大突破。他刚获得诺贝尔化学奖,AI研究科学有重大突破。但是说真话的人的意思,被资本狂热宣传扭曲了。似乎AGI(现在改叫ASI,超级智能)一年内就出来了,慢也就两三年。宣传中,美国人研发目标是冲击AI圣杯,干大事。

3. 另一个唱衰理由是,美国陷入了算力狂热,搞算力决定论,很不对劲。美国人和美国政府坚信算力是关键,代表人物是OpenAI的奥特曼。现在可以肯定,这家伙是个大忽悠。最新忽悠是5000亿美元的“星际之门”项目,要圈钱猛买卡,加上了特朗普和孙正义。美国那边认为做AI,最重要的事就是堆算力,谁算力多就最有希望竞争获胜。这就是英伟达H100等GPU被高价抢购的基本信念,FOMO,害怕错过。这是大公司才能玩的资本游戏,也是美国政府限制高性能GPU卖到中国的基本假设。AI研究领先中国两三年,是基于算力的估计。

4. 出于算力决定论,人们认为中国在大模型研发上肯定落后于美国。我一度也感觉不乐观,在一年多之前,中国大模型性能与Chatgpt确实有差距,“百模大战”结果似乎是“低水平热闹”。情况好转是忽然一下,中国不少公司基本知道GPT3.5怎么做的了。接下来的任务似乎是花个半年时间,追赶GPT4。

5. 同时,Meta花了很多钱训练,推出了LLama开源大模型。中国公司普遍被看成,靠魔改美国开源成果做项目。美国政府在针对中国的条款中,加上了对开源的限制。中国一些“观察家”,将中国大模型的落后,解释为美国没开源。

6. 现在情况一下逆转,说明了现在中国的研发实力和特性。中国聪明又勤奋的年轻研发人员,数量多到可怕。大模型研发需要的是人,琢磨各种主意去实验,而不是夸张的十万卡算力。中国百模大战的公司,没哪个特别有钱。但是大战能搞起来,说明技术扩散了,人才数量疯狂增长。我本来不认为中小公司能有出色的成果,但技术扩散,对大模型技术理解深入祛魅之后,明白了。大算力不是必须的,优化空间很大。计算机业界无数次把复杂的算法问题,效率优化了成千上万倍。

7. 中国许多大模型研发公司找到了感觉。deepseek和kimi、豆包等模型在快速进步,是因为优化搞得很不错。也说明美国AI没有技术秘密了,虽然搞了神秘主义,经常鬼扯,但是搞技术的人只要耐心琢磨细节,就能完全搞懂,开始自主创新。等优化的效率足够了,算力差距就拉平了,大公司和中小公司在同一个起跑线了,大家都要想本质的算法和数据结构问题,而不是拼算力。这和其它研发领域没什么不同,美国先做出来,中国公司优化大幅降低成本,扩大产能,把行业做大。

8. deepseek 的优秀工作就是结果。这个公司能够出来,根源是A股冲动股民提供的生态,量化赚钱容易,顺手去搞大模型基础研发。中美都是靠股市搞AI,只不过美国是靠大模型拉市值做多,中国是量化赚钱给大模型研发提供资金。A股已经贡献资金,把芯片企业实力做起来了,现在又把大模型实力拉起来了。美股,最终会被A股击败,人工智能牛皮,注定破灭。

500

站务

全部专栏