卷技术是美国大模型天命,卷价格是中国大模型宿命?

500

文 | 佘宗明

 

“卷”就一个字,大模型厂商们不会说一次,它们只会用行动表示。

但同样是卷,中美大模型似乎走上了两条路线。

刚过去的5月是全球“AI信息大爆炸”月份,透过这些信息会发现——

美国那边在卷技术

OpenAI发布了迄今最像“人”的AI大模型GPT-4o;

谷歌全线更新了Gemini,秀出了超强AI语音助手Astra,还有对标Open AI家GPT-4o、Sora的NotebookLM、Veo等产品;

苹果推出了首颗AI芯片M4;

微软发布了AI PC,更新了Copilot……

整体上,主打一个你追我赶、能力PK。

中国这边在卷价格

5月11日,智谱AI把个人版GLM-3Turbo模型产品的调用价格从5元/百万tokens降至1元/百万tokens;

5月15日,字节跳动旗下的火山引擎将豆包大模型API输入价格降至0.0008元/千tokens,把中国大模型市场价格卷入“厘时代”;

5月21日,阿里云宣布将通义千问旗下9款核心模型悉数降价,其中通义千问GPT-4级核心模型Qwen-Long的API输入价格锐减至0.0005元/千Tokens,降幅高达97%;

同日,百度也宣布,文心大模型两大主力模型ERNIE Speed、ERNIE Lite免费;

5月22日,科大讯飞宣布,讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API低至0.21元/万tokens。

同日,腾讯云也宣布,主力模型之一混元-lite模型即日起全面免费。

看上去,“晋西北乱成了一锅粥”,成了价格战下的国产大模型竞争局面的写照。

知名投资人朱啸虎就看热闹不嫌事大地说:一下子都从卷scaling law 180 度转弯变成卷价格卷免费了,说好的AGI(通用人工智能)梦想呢?

大洋彼岸在拼技术能力,中国同行在拼产品价格,两相对照,确实很容易引发“硬科技PK软应用”二元对立思维的回炉。

但与其批国产大模型在价格上卷成了麻花,不如思考下这道考题:都是大模型,为什么卷技术成了美国大模型的天命,卷价格成了中国大模型的宿命?

 

01

需要厘清的是,不是只有美国大模型才卷技术,也不是只有中国大模型才卷价格。

卷技术不是美国大模型的“专利”。在从拼参数、拼性能、拼Agent到拼价格的过程中,国产大模型也曾在复杂指令理解、知识记忆、幻觉抵御等能力上摩拳擦掌。

5月9日,阿里云就发布了号称模型性能全面赶超GPT-4-Turbo、堪称“地表最强”中文大模型的通义千问2.5,通义千问1100亿参数开源模型也在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B成为开源领域最强大模型。

对大模型而言,技术能力是1,其他的都是0,没有技术支撑很难走远。

价格战这股风,也不是只吹到了国产大模型那里。硅谷AI群雄打起价格战来也不含糊。

在5月的新品发布会上,Open AI就宣布GPT-4o支持免费试用,调用API的价格也比GPT-4-turbo降低一半,5 美元/百万tokens,拿走拿走别客气。

作为Open AI头号对手的谷歌看完后,立马喊了声“跟”,秉持着“敌不动,我不动,敌若降,我也降”的态度,把当家王牌Gemini大模型系列的Gemini 1.5 Flash的价格降到了0.35美元/百万tokens。

眼看着两位带头大哥都降了,作为小弟的硅谷当红AI初创公司Anthropic和Mistral AI也跟着吆喝了起来:走过路过不要错过,API价格只要0.25美元/百万tokens了。

白热化竞争的倒逼,大模型推理成本下降的带动,大模型技术迭代曲线放缓的牵制,都是硅谷大模型厂商降价的原因。

但整体上,中国大模型厂商在软硬件一体推进势头方面没有像美国厂商那么猛,美国大模型厂商在降价力度上也没有像中国厂商这么狠。

500

正因如此,很多人都担心国产大模型会陷入低层次竞争的内卷螺旋,跟Open AI、谷歌的技术代差会随之继续扩大。

诸如此类的担忧不是全无道理,希望国产大模型将技术力作为竞争主轨道也是正常心态,但不能由此逆推出中国大模型卷价格就是“窝里斗”的结论,更不必就此设置起中国大模型“只擅长内耗,不擅长创新”的稻草人议题来。

抛开理性不谈,中国大模型厂商“不是跟国外卷技术,而是在国内卷价格”,有些不够正确——它没考虑到“清场式遥遥领先”狂热者的感受。

但理性地看会发现,中国大模型厂商卷价格在所难免。它们未必不想赶超Open AI,是多重条件不允许;它们未必想卷价格,可它们首先得活下来。

对中国大模型厂商的卷价格,苛责不如试着去理解。

 

02

今年4月,工信部原部长苗圩在某论坛上说:在英伟达芯片几近断供后,中国跟美国的大模型算力差距逐渐拉大,所以和美国不要“打篮球赛”,要学会“下围棋”。

在其表达语境中,“打篮球”指的就是拼算力,那样免不了会被带着“满场乱跑”;“下围棋”指的是用好自身优势,加速大模型落地应用。

这说得很现实:受制于现实环境和发展阶段,中美大模型之间在技术上仍有不小的差距。

今年3月Sora刚问世时,华大基因CEO尹烨就曾感慨:据不完全统计,国内号称有大模型的公司已经有300多家,相信大部分还是“多小散乱”,面对ChatGPT在中文世界里(的表现),似乎尚能一战,但面对Sora的横空出世,可有一个能打的甚至是接近的吗?

说白了,技术沉淀、人才储备、融资环境上的差距是短期内难以抹平的,英伟达芯片断供更是不容忽略的掣肘因素。

这时候,缩短差距的正确打开方式,自然不是以己之短博人之长,跟Open AI们比算力。

不比依托于算力的技术能力,比什么?中国互联网过去20年的弯道超车经验已经给出了答案:比应用。

多年来,美国企业擅长从0到1式技术创新,强于“硬科技”,中国企业擅长从1到n式模式创新,强于“软应用”,美国互联网是技术创新带动应用创新,中国互联网是应用创新反推技术进步,几成业界共识。

正是因为应用侧抓住了超大市场内的丰富场景带来的机遇,才有中国互联网企业在移动互联网时代的蓬勃势头。也是因为利用场景优势对冲了“跟跑者困境”,中国互联网产业才有今天的繁荣景象。

近几年,在“卡脖子”之痛的影响下,不少人动辄将底层突破和应用创新对立,将二者分别对应上“星辰大海”和“萝卜青菜”,评价创新的多个维度、多元视角也经常被压减成单一标准,那就是“有没有造出光刻机来”。他们会将强调应用的模式创新置于硬科技的另一侧,看低模式创新的价值。

在此背景下,国产大模型“卷技术不足,卷价格有余”,俨然是有“原罪”的。

但中国大模型的发展,不能被这类杂音所困。国家信息中心专家张振翼之前就指出,美国在大模型发展中具备一定的领先优势,中国需要加强自身独特优势的探索。在他看来,中国发展大模型人工智能最大的优势,就是应用场景资源极为丰富。

 

03

而拼价格,就是拼应用的必经步骤。美团、滴滴、拼多多能成为超级应用,就离不开当年掀起的价格血战的“助攻”。

国产大模型大打价格战,也是这样:拼价格是表,拼应用是里。大模型厂商在价格上的“退”是为了寻求商业模式和用户增长上的“进”。不把价格打下来,就没法加速落地。

对阿里、腾讯、字节等巨头来说,开启降价模式背后都有一盘“以价换量”的棋:数据显示,国内AIGC用户渗透率目前只有6%。在习惯了免(白)费(嫖)的情况下,国内大量用户都是价格敏感型的。

降价经常是最有效的获客途径,没有之一。用的人越多,就越能压低均摊研发成本,越能降低推理成本。这样一来,没准能开启“降价让利-用户增多-规模效应明显-云业务增长-继续降价”的良性循环。

阿里云资深副总裁刘伟光曾说过,“AI推理的成本只有以每年10倍甚至百倍地下降,才能推动各行各业AI应用的爆发,预计未来大模型API的调用量会有成千上万倍增长。”而Open
AI CEO山姆·奥特曼最近在接受采访时就说,他相信高质量AI智能的成本将变得非常低廉,最终趋近于零。

值得注意的是,这波降价降的多是API调用价格,相当于是用降价迂回“抢人”——抢的是开发者。对大模型厂商而言,只有吸引越多的开发者,才能缔造更繁荣的应用生态、催生更多的应用创新。

而丰富的大模型应用生态,是撬动“飞轮效应”的前置条件。应用生态越完善,使用场景越多,用户规模越大,生成的新数据会反过来反哺大模型性能提升。

只有更大的使用量,才能打磨出更好的模型。就此看,卷价格未尝不是另一种“卷scaling law”。

按照国内朴实无华的商战节奏,现在是降价或免费,将来直接给开发者补贴,也不是不可能。

可以预见,这波价格战会将“百模大战”导入市场出清加速的节奏,大模型领域的格局洗牌在所难免。

对用户而言,也许会梦回2014年,那时网约车补贴大战正酣,用户成了价格战直接受益者;对许多AI创业公司而言,这可能意味着至暗时刻的到来——价格战开启的是淘汰赛,中小厂商不像大厂那样有充足的资金弹药,随时可能因为没法“跟”而被踢出牌桌,朱啸虎就断言,不是深度绑定大厂的模型公司基本已经出局。

但这无关“自己人卷自己人”,只是市场竞争的本相而已。

整体上看,腰尾部被淘汰,市场加速向头部集中,对中国大模型长远发展未必是坏事:不要认为大模型领域的幂律分布就等于“资本无序扩张”,事实证明,在“国际竞争中大显身手”方面,只有大企业才有大的竞争力。

 

04

中国大模型卷价格在所难免,但卷价格通向的不一定是竞争力提升——大模型核心竞争力提升,有赖于“价格下调-规模扩大-成本降低-利润提升-研发加强-技术创新”正向增强回路的跑通。

用户固然会因为免费来尝鲜,但决定他们能否长期留存的,是大模型的实际业务价值,能否高效完成任务、解决用户痛点,而非价格。

很多体验过的用户都知道,当下的不少大模型都有着很强的“不确定性”——它经常会变成CheatGPT。若这只是大模型跟C端用户相互“调戏”,那无非是提供了些笑料,可大模型应用最终得沉到行业产业场景中去。

行业场景专业度要求高、边际容错率低,必须得靠技术能力切实减少“幻觉”、避免“诱导”。

而从大模型技术能力角度看,价格战往往会呈现出两面性来:1,行业洗牌后,用低价换来市占率提升的头部厂商能获得更丰厚的回报,也能在研发上投入更多;2,恶性竞争下,会抑制企业利润,那些长线性创新项目投入也会受影响,进而损害长远竞争力。这轮价格战到底会通向哪一面,也看大模型厂商们怎么选。

零一万物创始人兼 CEO李开复就说,国内常看到ofo式的“疯狂降价、双输”的打法,大模型公司不会这么不理智,因为技术还是最重要的,如果技术不行,纯粹靠贴钱、赔钱做生意是行不通的。

百川智能创始人王小川也表示,百川智能不会参与降价,“‘千团大战’、滴滴快的补贴大战,背后都带有网络效应,那种商业模式改变了生产关系,改变了司机和乘客之间、外卖员和用户之间的关系。这次‘价格战’并没有改变生产关系,而是直接做生产力供给,是B端(企业用户)市场的‘价格战’。”

要而言之,大模型技术能力提升才是硬道理,价格战换来的不该是在愈发落后的系统上开发应用,而应是“价格力-技术力”相互带动的正循环基础上的系统持续升级。

价格为锚、应用为先,也许能帮中国大模型完成局部赶超意义上的“弯道超车”。但局部之外的部分,只能靠技术创新去补齐。在这点上,没有捷径。

这不是说中国大模型厂商不该卷价格,而是说卷价格的进阶方向还得是卷技术——如果有些人非要怪中国大模型“就知道猛卷价格”,那一切责任在于拜登,谁让他摁下英伟达芯片断供按钮的?

全部专栏