你光看见豆包火了!却没见豆包背后的大模型有多卷!

500

用“AI一天、人间一年”来形容,2024年AI大模型的进展情况丝毫不为过。在过去的一年中,一些关于AI的预言陆续得到验证:在智算大潮之下,英伟达顺利进入3万亿市值俱乐部;中国开源势力崛起,通义大模型DeepSeek硬杠Llama;国内AI视频生成模型能力飙升,与Sora掰手腕;手机和PC大厂掀起硬件狂欢……

而在一众大模型厂商中,一直略显“沉默”的字节跳动,凭借着一款豆包大模型横空出世,迅速横扫国内外一众选手,一举拿下了全球第二、中国第一的桂冠,这成绩属实让众多友商汗颜。毕竟,无论是起步时间还是储备过程,字节跳动在押注AI方面,特别是大模型方面都慢了友商好几拍。然而仅仅一年多时间,豆包就一骑绝尘,将众多对手甩到了身后,这成绩放谁也没话说。

“后来者”豆包何以后来居上?

在今年11月的AI大模型月活跃排行榜上,豆包App以5998万MAU的成绩,稳居全球第二,仅次于OpenAI的ChatGPT,在国内排名第一。而它的海外版Cici的MAU也有1267万,排在第22位。而在年初,豆包的月活跃用户数也才仅有173万。那么,作为“后起之秀”的豆包,到底是怎么起来的呢?

首先,字节跳动内部迅速统一共识,在资源、人才、机制等方面,给豆包大模型研发提供了全方位的支持。为了赶上这场AI技术革命,字节跳动迅速调整战略布局,采取一系列措施,包括大规模招募AI人才、成立专门的AI部门Flow、整合内部资源、实施赛马机制等,以加速豆包大模型的研发进程。

在一番“大力出奇迹”的操作之下,到今年3月份,豆包的下载量和月活跃用户双双登顶。到去年11月份这种趋势继续得到了延续。尽管ChatGPT仍以超3亿月活遥遥领先(APP+web用户),但豆包的崛起速度仍远超其竞争对手。国内的Kimi、文小言、通义千问等应用,在用户规模上也被豆包甩在身后,豆包甚至超过后面三者月活用户的总和。不难发现,在做豆包这件事上,字节跳动很善于把握时间窗口(善用开源资源),全方位地调动一切有利因素,将新技术迅速转变为最终成果。

其次,在具体策略上,全方位贴着对手打,核心突出一个“卷”字。随着国内百模大战的展开,围绕技术与产品的迭代速度,以及商业化效率的比拼已经全面展开。为了弥补在时间差上的不足,字节内部不惜血本,从各个方面全面开“卷”。其具体体现为,C端卷用户,B端卷价格,与对手卷算力。

比如,为了推动豆包用户的增长,字节跳动累计在C端投入不下10亿元的投流费用。这种高强度的市场投放,让豆包迅速在社交媒体、搜索引擎和短视频平台上,占据了用户的注意力,形成了强品牌记忆点。而在B端战场,豆包更是祭出了价格大杀器。在今年5月火山引擎FORCE原动力大会上,豆包Pro 32k模型正式定价是1千Tokens 0.8厘,豆包Pro 128k模型正式定价为是1千Tokens5厘钱,一口气将国产大模型的tokens定价,带到了“厘”时代。这一番颇有“气量”的降价,直接打了对手一个措手不及,逼得他们只能轮番跟进。

此外,大模型之争也是算力之争。为了确保胜出,字节跳动仅在AI上的资本开支,就达到了800亿元,这个数值接近BAT三家的总和(约1000亿元)。而根据字节最新披露的数据显示,2025年字节跳动的资本开支,还将增加到1600亿元,其中900亿元用于购置AI算力集群,700亿元用于IDC基建和网络设备。不难发现,字节跳动的饱和式攻击,正是其后来居上的核心原因。

赢家通吃模式再现大模型

随着国内大模型的持续进步,一大批国内大模型公司正在崭露头角。整个2024年,国内大模型圈子,不仅诞生了吸金200亿的大模型“六小虎”,就连一些融合AI大模型应用的AI硬件公司,都拿到了不少融资,啥都不缺的大厂表现就更好了。据公开数据显示,截至2024年11月初,百度文心大模型的日均调用量超15亿次,相较一年多前增长约30倍;截至2024年12月中旬,豆包通用模型日均tokens使用量超4万亿,较7个月前首发时增长了33倍…

不过,进入2024年下半年,风向突然骤变,曾经风头无两的大模型“六小虎”,也面临严峻的现实考验,不仅融资受阻、商业化也遭遇严峻挑战。与此同时,一批技术先进的公司快速崛起,大厂攻势日益凶猛,此消彼长的行业规律开始在AI大模型领域重现。

一方面,主流头部大厂普遍在用户、场景与算力方面,具备相对应的比较优势。比如,百度有自己的超级APP和自己的海量搜索资源,还有百度智能云等云支持;阿里有支付宝、淘宝、天猫、菜鸟等一众超级应用,更有阿里云从旁辅助;同样的优势,在腾讯与字节跳动也是不在话下。自带众多豪华资源的大厂,在做大模型过程中,更是如鱼得水。

反观很多初创公司,他们的数据资源都还需要从第三方平台获取,不仅需要大量的投流费用,还容易被对方拿捏七寸。据移动营销平台AppGrowing数据,2024年以来(截止11月15日),Kimi、豆包、星野等国内十款大模型产品,合计投放超625万条广告,投放金额达15亿元。但对于占有流量渠道的大公司而言,他们根本就不需要投入如此多的资金,仅凭自己占据的流量优势,就可以直接碾压对手。

以明星AI大模型公司Kimi为例,年初它曾在抖音、B站等内容APP上刷屏,并获取大量用户,但下半年Kimi就被限制在抖音投放,不得不转战快手等平台。据“AI新榜”公众号统计,截至10月29日,Kimi在过去三个月内的广告投放总数已经超过2500条。其中,在快手平台上投放的内容超过2100条,几乎占据总投放量的84%。在B端市场的优势,就更显著了。大厂凭借着比初创公司更低的tokens成本,互联网大厂可以迅速以极低的价格,让B端用户“尝鲜”,这些优势是那些小的初创公司所无可比拟的。

另一方面,技术先进的公司和大厂基于自身优势,在商业模式上持续挤压初创公司的生存空间。比如,卖API是不少AI大模型公司的重要生意模式。相关数据显示,OpenAI预计2024年将依靠API赚得5亿美元,占总营收的15%。据CNBC报道,Anthropic对API的依赖更大,预计总营收的60%~75%将来自第三方调用API。

然而,在国内提供大模型API,已经变成了模型厂商抢占市场的方式,并未被寄予丰厚的利润预期。2024年5月,DeepSeek推出DeepSeek-V2 ,价格直接“杀”到了每百万输入Tokens1元,每百万输出Tokens2元。随后豆包迅速跟进,将价格进一步打到了“厘”时代。面对价格战,阿里通义千问直接将价格下调了97%,百度直接宣布两款模型免费。

这样的“降价”幅度,直接将一众初创大模型公司逼到了墙角。比如百川智能创始人王小川,就表示不会跟进价格战;零一万物创始人李开复表示,“如果技术不行、单纯降价赔钱去做生意,不会有赢家。”而在大B的私有化部署方面,初创公司也不占优,目前中标的公司除了电信三巨头,就是百度、腾讯、华为、讯飞等国企和巨头,初创公司只有智谱AI的少量中标单。

不难发现,无论是在具体的技术较量还是商业化比拼方面,拥有较强技术实力或者资源的大厂,都已经在全面挤压初创公司的生存空间。照此发展下去,赢家通吃模式或将在该领域重新上演。

大模型洗牌进入加速期

正如其他新技术演变的趋势一样,大模型的上半场都是在拼命“造锤子”,即使因此造成了行业资源的浪费也再所不惜。但随着各类大模型的出现,整个市场正在快速蜕变,围绕商业化与先进技术的推广逐步提速,推动整个市场加速市场出清。

其一,技术研发开支的增大、融资的不顺,迫使各路厂商加快大模型商业化的进程。从初创公司来说,由于市场竞争格局的变化,此前在融资上一路绿灯的初创大模型公司,在年中便开始“遇冰”,输血的不足加速了初创公司的商业化进程。而在大公司方面,动辄几十上百亿的算力以及网络设施投入,虽说并不会影响其基本盘,但毕竟也是笔不小的开支。

当然,从大模型技术本身的情况来说,随着大模型推理成本的急速降低,以及轻量级大模型和MOE(混合专家模型)的日益流行,不少大模型已经实现了更低成本、更好效果的能力。

反应到落地一线,以往动辄千万元级别的单子少了,更多项目下探至两三百万元,一些单一场景的大模型应用成本甚至只需数十万元,这是尝鲜客户能接受的价格段。有人预计,到2025年随着大模型推理成本的进一步下降,大模型的落地速度会进一步加快。

反映到具体的数据上,则体现为大模型项目数量的快速暴增。根据云头条的信息,今年前11个月,大模型中标项目达到728个,是2023 年全年的3.6倍。与此同时,商业化也从粗放的面向全行业,向单一行业深度发掘;服务方式从买单走量,向“应用效果”、陪伴式服务转变。

其二,基于大模型进化的需要,没有实质性帮助的大模型将沦为可有可无的“花瓶”,丧失进化迭代能力,逐渐被用户所抛弃。经过2024一年的激战,在基础大模型层面,国内外的大模型公司已经基本定型。比如美国如今只剩下了OpenAI、Anthropic、Meta、谷歌以及xAI,在中国基础大模型,则收敛到百度、阿里、智谱、字节、讯飞、腾讯等企业。

基本上,经过一年激战,基于基础大模型的套利空间已经消失,未来想要胜出就得靠做出有影响力的AI应用。从行业来看,虽然之前业内也出现了类似AI绘画、AI作诗、AI书法等应用,但其应用场景相对狭窄,一旦用户新鲜感消失就会卸载APP,应用很快沦为“可有可无”的花瓶,丧失迭代能力。

另外,在商业能力方面,也存在预训练成本高、国外订阅模式走不通等全新的挑战。考虑到大厂与初创公司的实际状况,要应对这样的外部挑战,显然难度系数是完全不同的。如果初创公司犯了战略错误,很可能会因此被淘汰出局。可以预见,在经过了初步的“百模大战”之后,国内大模型或将迎来新的大洗牌。

站务

全部专栏