300个AI「算」出了这届世界杯的冠军 ?
文 | 阑夕
美加墨世界杯就要打响了,临开赛前,国产模型Kimi整了个大活儿:
它要一口气调用包含300个子Agent的集群,从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等多个维度并行研究104场世界杯比赛,并公开预测结果。基于当前的信息,Kimi预测可能要夺冠的是:
德国。

聊这个我可就不困了,作为一个战绩可查的资深⋯⋯中国体彩消费者,我对Kimi敢于立Flag的勇气,是深感尊重的。
要知道,从盘口来看,德国的赔率(9.5)并不低,在所有球队里排在第7位,所以Kimi并没有按照最大概率——也就是最稳妥的方案——去做判断,是真有自己的想法的。
当然,即便是选夺冠热门法国、西班牙,赔率(4.5)的风险仍然很高,说白了,早在开幕前就暴论最后的冠军,本身就是一件吃力不讨好的事情。
所以我才要狠夸Kimi的「敞亮」,不光是冠军,Kimi还要对全部104场比赛全都做出公开预测,包括赛后核验以及复盘,一场不落。
这就更硬核了,完全不怕打脸呐⋯⋯(注意,该预测非投注建议、非投资建议、非收益承诺。)
应该无须赘述吧,Kimi这么兴师动众的「Predict In Public」,并非是为了真的去当那个洞悉神谕的预言家,作为一家注重审美和趣味大模型厂商,它是在用一种奇观的形式,向世界演示AI的能力边界和局限性。
· · ·
严格来说,Kimi并没有笃信德国是最有希望夺得这届世界杯的参赛队伍,而是认为德国的市场定价在强队里过于低了。
在使用了8种数学模型——包括SLO评级、Sixon-Coles泊松、XGBoost机器学习、Opta蒙特卡洛模拟等等——对48支球队逐一分析之后,Kimi得出了这么一个结论:
德国的模型预测概率,和市场赔率存在最高的偏差值,达到+3.6pp。

什么意思呢?
就是在判断德国是否有机会捧起大力神杯这件事情上,模型比市场多预测了3.6个百分点,所以认定德国,在理性上是回报确定性最高的选择。
就很像量化投资的策略,一家公司好不好并不重要,重要的是它有没有被市场正确定价,一家被高估的好公司,和一家被低估的差公司,显然后者更有买入潜力。
不同的是,量化机构需要雇佣一大票分析师,以及重金采购商业软件,而Kimi靠着几百个Agent昼夜不息的连轴转,自个儿就把整个项目给做完了。
如果不是亲眼所见,我是万万不敢相信的。
所有的细节,都填在了Kimi同时发布的预测报告里,完整版PDF超过200页,量大管饱。
我帮你们看了⋯⋯好吧,是Kimi K2.6帮我帮你们这份报告的重点整理了出来,非常有启发性。
· · ·
报告的作者,是Agent Swarm(集群),这不是一个人名,Kimi把协调多个智能体开会干活的能力,做此称呼。
以及,多个智能体的意思,是上限可达300个。

Agent Swarm用来搭建这次预测工程的组织架构,很有意思:
最上层,是战略组,包括总指挥、质检员和核验者,负责最开始的分配资源以及最后的验收结果;中间层,是战术组,这个就比较丰富了,有研究赛程发展的,有归纳历史规律的,有分开算小组赛和淘汰赛的,有对黑马球队留心眼的,整个团队分工明确;最下层,是战场组,主要清洗海量数据,比如球员的伤病、球队的特点、比赛的天气、FIFA的排名等等;
甚至连反方的「工位」都被预留了,专门寻找反例和翻车风险,交叉对比各种冲突,直到得出大多数Agent都认可的结论。
是不是很有五脏俱全的味道?
特别严谨的是,Kimi还对2010年-2022年的4届世界杯做了回溯演练,在只使用目标年份之前的数据训练这个前提下,用这套协作模式进行预测,然后叠加实际赛果,反思自己犯了哪些错误。
有句话真不知道当讲不当讲:硅基生命的态度,可能超过了90%的碳基生物⋯⋯
· · ·
话说回来,预测世界杯,本质上是一门玄学,非人力所能及的不确定性太高了,也并不存在某种原理,只要算准了,就一定能够保证正确。
所以完全不能排除的画面也包括:一顿操作猛如虎,一看战绩零杠五。

但俗话说得好,过程好,结果不会差,为结果而忽视过程,结果反而好不起来。
醉翁之意不在酒,在乎山水之间也,而Kimi的山水之间,就是要告诉大家,Vibe Working的时代已经到来了。
根据Gartner的统计口径,全球大概有10亿-13亿知识工作者,占到整个劳动力市场的30%左右,在发达国家甚至能够达到40%以上的占比。
所谓的知识工作,泛指主要通过计算机设备处理各种信息的岗位,包括但不限于写代码、做分析、出报告、设计系统等等,其中的写代码部分,我们都知道已经被Vibe Coding给稳稳接住了。
但毕竟编程只是其中的一个子集,在整个知识工作的范畴里,AI的渗透受阻可以归咎于很多原因,比如不够标准化,或是交付难以验证,但在基座模型的飞速进步下,困难的保质期都不长。
大力出奇迹,一杆可清台。
· · ·
Coding依然很重要,或者说,世界是可被编码的,这本身就是AI得以成立的底层逻辑。
无论是图灵坚信思考是一个工程问题、而非哲学家心中的灵魂之类,还是香农在上世纪五十年代就用人类受试者去玩猜字游戏、用以论证智能始于对信息的预测,所有的历史研究和前沿走向都并轨于同一个共识:
凡事皆可压缩。
当人类知识的总和被压缩到了极致,就能制造一个通晓万物的机器出来,它能通过模拟已经存在过的和还没有发生的所有过程,去得到每一项任务的最优解。
这听起来很科幻,也足以引起事关自由意志的思辨,但我们正确切的走在这条路上,大模型的运行原理就是预测下一个词元,这是众所周知的,香农的遗憾在于他买不到英伟达的GPU。
所以能够理解Kimi为什么要预测世界杯了么?
面对这种长链路、随机性、没有标准答案的复杂目标,如果AI也能完成媲美甚至优于人类表现的任务,那么它在通用性层面的可用,就不再存疑了。
事实上,Kimi已经把同时调度300个Agent分工合作的能力,塞进了客户端里,在新增的Kimi Work模式下,模型已经实现了把数据源、浏览器、本地文件、Excel、PPT、Word 等工作环境串起来,让那300个Agent住进用户的电脑里。

而Kimi Work的内核,还是源自Kimi Code编码助手的能力,程序员继续用Coding Agent生成代码,而更广义的知识工作者,则可启用Kimi Work,在桌面上指挥 AI 做调研、分析、自动化和交付物。
· · ·
2010年的世界杯,数以亿计的人类在围观一条名叫保罗的章鱼,用它黏糊糊的触手从闭合的箱子里选择比赛赢家。
16年后,开箱的角色变成了连生物都算不上的AI,从克苏鲁的古神符号,到后现代的赛博朋克,如此交替,本身就充满了隐喻。
隐喻那种不可言说的混沌,让渡给了可被测量的科技。
这让我想起在自己投入了无数个通宵的游戏「文明6」里,解锁信息时代的科技之后,会出现在屏幕上的那句话外音;
「现在天上有31颗卫星在地球上空环绕,不为别的,就为了告诉你便利店怎么走。」
取之于硅,用之于碳,这才是AI正确的打开方式,对不对?



科技互联网博主




