终于,可灵被列入了国产AI三巨头
文 | 阑夕
在「政府工作报告」的答记者问上,起草组成员、国务院研究室副主任陈昌盛在提及春节前后中国AI产业跑出加速度时,点了3个产品的名字:
DeepSeek、宇树机器人、可灵。
DeepSeek已经不需要在做任何介绍了,宇树机器人也因春晚的秧Bot反复出圈,但在可灵的市场认知上,还存在未被发现的叙事。
注意,未被发现和需要创造,是两个截然不同的概念,差别在于是否存在既有事实的支撑。
对于大多数人来说,DeepSeek能够上手即用,宇树机器人尽管售价不低,但它毕竟也是摸得着看得见的实物,能够贡献表演素材,而可灵还在信息差的坡道上,等待视频大模型全面爆发的质变时刻。
至于在「政府工作报告」的发布场合现身,意外性和必然性可能都有,这更像是历时9个月来厚积薄发的一次结果,而非起因。
· · ·
2024年2月,OpenAI发布了视频大模型Sora,一夜之间碾压了当时都还处在动态图片级的同行产品,一度被视为摘下了文生视频领域的皇冠。
然而Sora却在随后几乎长达一年的时间里始终没有发布,成了一个望眼欲穿的期货,同时合作导演的集体反水,也透露出OpenAI的预期管理策略:它对产出内容严格管控,禁止那些表现水准不佳的视频流出,由此维持Sora的超高水准。
某种程度上,快手在2024年6月直接全球上线可灵,打乱了OpenAI精心规划的布局,可灵的视频生成固然并不完美,但它却是第一个公开可用的同级别视频模型,很快就在年内获得了600万新增用户。
更重要的是,可灵证明了技术垄断效应的不成立,Sora的DiT路线确实令人感到惊艳,但在几个月内,其他公司就能迎头赶上,并打破一时的领先可以换来躺赢的美梦。
可灵本身就是一个技术驱动产品的正确样本,几经版本迭代之后,可灵已经从当初的行业黑马,变成了新入局者必须跨过的大山,强如Google在推出自家的视频大模型Veo 2时,就把可灵标记为了最大的竞争对手,因其测评结果是全球所有同类产品里最能打的。
来自竞争对手的「认证」,往往才是最客观的勋章。
大模型竞技场Artificial Analysis的盲测排名也证明了可灵的含金量,在所有主流视频大模型里,可灵1.5的票数排在榜2,强于Sora、Pika、MiniMax等竞品,仅次于Google今年推出的Veo 2,而后继者可灵1.6则正在飞速爬榜中。
另外,根据广发证券的研报测算,可灵的视频生成费用大约在0.83元/条,是Veo 2和Sora的1/4左右,「量大管饱」的经济性,也是可灵能在全球圈粉的重要原因,毕竟「AI很美好,价格不友好」一直都是普通用户最大的痛点之一。
千帆竞发,百舸争流,欢迎来到实力至上主义的教室。
· · ·
不久前,The Information发了一篇深度报道,讲述Runway是如何争取打入好莱坞市场的,和AI取代电影制作的口号不同,Runway以一种近乎谦卑的态度,希望建立作为创作增强资源的全新定位。
举例来说,视频大模型的生成质量距离电影成片的交付还有很远距离,但在少量镜头的供给层却是有机会的,尤其可以节省CG成本,而不是让演员失去工作,「使用传统技术实现1000名中世纪士兵骑马列阵的场景相当昂贵,但AI却能极具经济性的快速生成。」
所以Runway的创始人大部分时间都穿梭于旧金山的制片商会议室里,Sora的运营策略也是类似的,希望成为专业化的生产力工具,有点类似Adobe公司赢得摄影市场的历史路径,和那些面向普通人的视频大模型应用区别开来。
不过,所谓「面向普通人的视频大模型应用」,以Pika和PixVerse为代表,也有它们的路线图。
比如Pika每次出圈,靠的都是在功能里预设的特效模板,不是把一只猫捏扁解压,就是将一个人吹成气球,这种整活能力非常适合社交媒体的传播,激发用户和朋友分享有趣的短视频。
只是无论哪条路线,眼下都面临着商业模式难以为继的困境,专业化可以带来大额现金流,却也会难以避免的把路越走越窄,娱乐化擅长创造流量自我造血,但流量的分发和消费是由内容平台承接的,和自己没有太多关系。
恰好,可灵同时走了两条路线,并以一种「既要又要」的结构性优势,分别克服了两边的短板:
它是一款独立的AI产品,同时也是快手在主营业务之外耕耘出的“新产物”。作为专业化内容生产工具的时候,创作者可以在可灵AI完成独立的内容创作与生产;依托快手的内容社区属性,精品AI内容又能完成从生产到消费的完整链路,最终实现端到端的价值循环。
当然,AI之于快手生态的价值还远不止此。比如,快手在商业领域推出视频AIGC产品磁力开创,为商家提供了短时间迅速生产数百条视频素材的能力,产品背后也有来自可灵AI的能力加持。AI和商业生态的深度耦合,进一步提升了主营业务的想象空间。
· · ·
去年,快手已经推出了AIGC导演共创计划,李少红、贾樟柯、叶锦添等9位导演,通过可灵创造出了风格各异的9部短片,并被中国电影博物馆永久收藏。
而在新兴的短剧赛道,用可灵制作的AI作品「山海奇镜之劈波斩浪」、「新世界加载中」先导片更是先后突破国内首创的高度,在和影视产业的合作探索这件事情上,可灵是所有中国大模型产品里走得最远的一个,没有之一。
另一方面,快手也是一个拥有几千万创作者的内容平台,这些创作者天然就是可灵的用户,无论是用可灵来降本增效,亦或发挥创意,生产出来的视频也可以直接获取流量价值,成为内容生态的共建者。
这意味着,在产品端,快手随时都能把可灵的更新——比如特效模版——推送到4亿日活的用户面前,这种触达能力,是其他视频大模型很难具有的。
事实上,文旅机构和各大高校最近就已经把可灵的「快来惹毛我」创意特效玩出了梗,把知名地标变成毛绒玩具,不但在快手站内的播放量数以亿计,还火到了小红书等站外平台。
这就是快手-可灵的结构性优势,技术的投入成果,可以由产品去做变现,二者相辅相衬而非相互割裂,形成了一个「AI公司里最懂内容、内容公司里最懂AI」的竞争壁垒。
广发证券的研报也测算了,考虑到快手日均上传逾4000万条视频,若按10%/20%/30%的视频可能会在未来采用AI生产,那么潜在的新增年化收入也将依次达到12亿元、24亿元和36亿元,这还没算快手已经在将可灵商业化到广告主服务的业务上了,伊利、vivo、联想、周大福等一线品牌都是买单者。
甚至连Meta也做出了类似的选择——在预热了效果不俗的视频大模型Meta Movie Gen之后,时隔半年Meta也没有让它上线,根据媒体报道,Meta是想先把视频大模型用到Instagram等自家产品上,让其能力覆盖用户的使用场景,而不是孤身作战。
所见略同的共识,是最有分量的投票选择。
要知道,视频大模型也被认为是通往世界模型的入口之一,只有得到了为物理世界建模的力量,人类才能真的实现「AI洗衣做饭,自己写诗绘画」的理想,这是在消费级应用的形态之外,视频大模型肩负的深层使命,每家公司、每个大国都不会愿意缺席。
· · ·
就在上周,A16z发布了每半年更新一次的消费级AI应用排行榜,在网页端,可灵首次入榜,并在顺位上比Sora、Runway等美国厂商要更为靠前。
而在这张50强的表单里,由中国公司出品的应用,总计有13家,占比超过1/4,这也是头一次,就像莎士比亚为戏剧「暴风雨」编写的开场白,「凡是过往,皆为序章」。
在2024年度3M科学现状指数(State of Science Index)的调研里,高达90%的中国受访者认为AI将从根本上改变世界,远高于77%的全球比例,且有93%的受访者已经尝试过在工作中使用AI——即使只是浅尝辄止——这也将75%的全球比例甩在身后。
中国曾是工业化的脱节者,如今则是工业化的受益者,对于技术发展的判断和接受,中国市场的反应往往都是支持胜过疑虑、行动勇于观望,从移动互联网时代一举摘下Copy to China的帽子,到人工智能时代后发涌现出一个个全球瞩目的突破,很难说因果是否早已种下,只是注定要迎来收获。
唯一可以确定的是,未来早已不均匀的到来,和前沿科技距离越近,就越是有机会参加塑造产业上游的现场,就像这次被点名DeepSeek、宇树机器人、可灵,它们都在奠定人机共生的模式,也验证着「人工智能+」的国家期待:
赋能千行百业、走进千家万户。