大模型低价火拼间,智谱AI“钱途”黯淡

500

智谱AI陷入“盛世危局"。

@科技新知 原创

作者丨王思原  编辑丨赛柯

前不久,来自沙特的一笔“热钱”涌入一家国产大模型企业,成为万众瞩目的焦点。

市场消息显示,国内人工智能初创公司智谱AI在今年6月初完成新一轮融资,投资方为中东石油巨头沙特阿美(Aramco)旗下风险投资部门管理的基金Prosperity7,融资金额达4亿美元。

此轮融资后,智谱AI估值将达到约30亿美元,跻身200亿俱乐部,也成为第一个获得国外基金机构融资的国内AI独角兽。

智谱AI能够成为投资界的焦点,与其清华系背景,以及独有的自研技术路径脱不开关系,但资本的簇拥,并没能让智谱AI脱离大模型行业普遍的焦虑。

智谱AI相关高层多次强调,对标Open AI“是(公司)成立以来的目标”,而为了完成目标,或者说为了努力留在牌桌上,激进的商业化拓展便成了智谱AI近两年打造的新筹码。    

然而随着大模型技术的快速演进,以及市场商业逻辑的不断变化,智谱AI也迎来一些值得思考的问题:智谱AI的优势究竟是什么?离OpenAI还有多远?商业化上如何解题?未来的想象空间又有多大?

Part.1

与OpenAI试比肩?

早在2020年,智谱AI便开进行GLM预训练架构的研发,并训练了100亿参数模型GLM-10B;2022年合作研发了1300亿级超大规模预训练通用模型GLM-130B;2023年,智谱AI推出千亿开源基座对话模型GLM系列,并在2024年1月推出GLM-4。

入局时间和迭代节奏几乎跟ChatGPT一致,也因此拿到众多投资,并被看作国产OpenAI的先驱。

这次中东的大额投资,《金融时报》给出的标题非常直白:沙特基金投资中国,意在打造OpenAI的竞争对手。

分析人士也指出,这笔投资一方面给智谱AI带来了资金支持,有利于发掘市场机遇,拓展后续可能的国际业务,另一方面,中东资本也并不希望将大模型时代的话语权完全交给欧美。

值得注意的是,5月下旬在首尔举行的第二届人工智能安全峰会上,OpenAI、谷歌DeepMind和Anthropic、微软、亚马逊、IBM、Meta等AI圈头部公司悉数到场,而智谱AI同样作为唯一受邀的中国大模型企业参会,与上述公司达成技术和安全方面若干协议。

与全球顶尖AI巨头同台,来自全球范围内的认可短期内接踵而至,让智谱AI正逐渐向大模型舞台的中心区域靠拢。

不过,一个不得不接受的事实是,目前智谱AI与全球顶级大模型企业仍有一定差距。

去年底智谱AI CEO张鹏也直言说,“GPT-4的发布让我们认识到,其实距离还是很大的,人家也在以更快的速度往前奔跑。”这点从两家的产品以及技术层面也能窥知一二。

首先在模型规模方面,OpenAI的GPT系列语言模型规模已突破万亿,而智谱AI的模型规模还在千亿级别,作为基座模型,数据规模的大小,也意味着在处理自然语言数据的能力上,存在一定差距。

从技术角度来看,OpenAI从一开始走的便是通用大模型的路线,所以更加注重通用性、可移植性和可扩展性,这也使得GPT系列语言模型可以在多个场景下应用,并且具有高度的可定制性。

相比之下,智谱AI的技术路线是“大模型+小模型”,通过大模型的预训练和微调,来适应不同场景和任务的需求。这种技术路线可以提高模型的泛化能力和应用范围,就相当于将一个大模型分割成多个小模型,但也会产生模型复杂度高、计算量大、训练时间长等问题。

更为简单的说便是,无论资金成本还是时间成本都会大大增加。不过不能否认的是,这种路线在行业专注度上也更为出色和精准,对于垂直行业应用或许是一个较优的解法。

张鹏也坦言,和国外大模型相比,国内的大模型发展起步晚了一些,加上高性能算力限制、数据质量的差距等,国内大模型在规模和核心能力上都与世界先进水平存在一定差距,这样的差距大约在一年左右。    

事实上,智谱AI面临的挑战不仅仅是技术上的,更在于其商业化和生态构建的能力。能否训练出与GPT-4相媲美的语言模型,对于智谱AI来说至关重要,但更为关键的是,如何将技术优势转化为商业价值,构建起一个健康、可持续的生态系统。

Part.2

商业化难题涌现

与其他创业团队不同,从成立之初,智谱创始团队就表现出有别于多数创业学者的商业热情。

据熟悉智谱节奏的投资人透露,从去年2月开始,张鹏等人便开始对外寻找商业化负责人,招揽了前大搜车CTO、连续创业者张帆,据科技新知了解,截至去年底,智谱AI的商业化团队已经从最初的十几人迅速发展到上百人,从售前到售后、包括解决方案均建立了完善的团队。

而之所以快速搭建商业化团队,除了热情外,更实际的还是资金问题。随着智谱AI大模型能力持续提升,训练参数自然也需要提升,对算力、存储等需求也会增加。粗略来看,私有化部署一个千亿规模的大模型,一年费用接近4000万,但这4000万花出去能带来多少价值,却是一个未知数。

所以资金从哪来,是一个亟待解决的问题。按照智谱AI的策略,B端的付费意愿比C端好很多,所以智谱AI从一开始就瞄准B端。而其盈利方式和行业盈利方式基本一致,一是根据客户需求,提供大模型定制化开发服务。二是标准版大模型,提供API接入方式,按照tokens使用收费。    

然而大模型行业的“价格战”来的比预想的更快。

目前,OpenAI年内GPT-3.5

Turbo降价50%,还更新了可限量免费使用的GPT-4o,API价格同样五折。国内AI大厂更是“丧心病狂”,字节跳动、百度、阿里、科大讯飞接连砸价,大量性能尚可的模型官宣免费,付费业务的定价标准甚至降至小数点后四位的水平——阿里云Qwen-Long
API输入价格降至0.0005元/千tokens,字节跳动豆包大模型0.0008元/千Tokens。

与这些大厂相比,智谱AI无论从公司体量还是资金储备上显然都不在同一量级,但颇为意外的是,6月第一周,智谱AI也官宣下场参与价格战,入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅高达80%。

毋庸置疑,大模型定价的持续走低有望带来更快的商业化落地,但同时“价格战”往往意味着企业需要在价格上做出让步。另外,根据工信部赛迪研究院最新数据,预计在2024年国内市场规模仅有132亿元,然而随着大模型供给和开源企业增加,短期内买方仍以国企、央企等具备资金实力和需求场景明确的企业为主,这十分考验智谱AI的销售团队。

事实上,对于初创企业来说,口碑不够、根基不稳本就是其销售短板,尤其是和华为、阿里、字节等厂商相比,其在客户积累上本就不足。

以华为为例,做ToB服务起家的华为,手中已积累大量国企、央企等客户,而且内部有专人跟进这些客户需求。一旦这些客户有大模型需求时,华为则会迅速介入。另外,针对ToB销售,大企业还可通过交叉销售的方式分摊成本,并且为客户定制更系统的解决方案,这也是智谱AI这些初创企业短时间难以突破的。

客观来看,目前国内大模型的业态,属于百花齐放,已经开始出现同质化的特征,这样的大背景趋势下,智谱AI凭什么脱颖而出呢?   

Part.3

智谱AI筹码渐空

此前业内对于智谱AI共识的优势有三点,一是商业化快,二是算力多,三是生态在不断完善。

但站在当下来看,商业化能力已经开始与价格挂钩,价低者得逐渐成为清晰的走向;至于算力,简单来说,谁的卡多,谁能成为中国OpenAI的机会便更大。

然而没人知道其他同行手里还有多少“王炸”,在超级认知、超级对齐上的技术突破,会被快速被迭代跟进,坦白讲目前国内外主流大模型在算法层面尚不存在代际差,但是在算力和数据方面存有差距。

所以,对于智谱AI来说,生态完善或许才是重中之重。

按照智谱AI规划,将联合生态伙伴发起总额10亿元的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。智谱AI还为大模型开源社区提供计算卡、奖金、免费API等方式用来支持与大模型相关的开源项目。此外投资相关AI公司也是其计划之一。

然而,智谱AI生态上的布局看似“热火朝天”,但也存在漏洞。

纵观这些大手笔投资,几乎都是围绕技术层面,但模型质量的提升,除了技术进步外,另一个重要的点是要有扎实且优质的数据储备。除了传统的文本处理之外,语音识别、图像生成、视频理解和推荐系统等也都是未来发展方向。

只是与一些同行相比,智谱AI在数据的多样性和规模上可能存在一定差距。例如,百度、字节等大型科技公司拥有更广泛的数据源和海量的数据积累,能够涵盖更多领域和场景,从而为模型训练提供更丰富的素材,并且对于一些本就以内容起家的科技企业来说,也有更完善和精细的数据标注体系,确保数据的准确性和可用性。

另外,互联网巨头在计算、存储能力以及数据资源方面有着较大地优势。而对于智谱AI而言,这些都需要其投入大量的资金去搭建。当然,与云厂商巨头的合作,可以很大程度上降低研发成本、提高研发效率。但目前主流的云厂商几乎也都有自己的大模型产品,智谱AI能否拿到合适的价格,以及如何解决数据安全的可信,都是问题。

当下智谱AI正于大模型的江湖中奋力闯荡,虽获资本青睐、技术亦有突破,然与顶尖高手相较,差距仍存。商业化的鏖战、生态的构建,皆为待解之难题。未来,智谱AI是能披荆斩棘、笑傲江湖,还是深陷泥沼、铩羽而归,还需时间给出答案。   

全部专栏