300个AI「算」出了这届世界杯的冠军？

阑夕
科技互联网博主

2小时前

文｜阑夕

美加墨世界杯就要打响了，临开赛前，国产模型Kimi整了个大活儿：

它要一口气调用包含300个子Agent的集群，从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等多个维度并行研究104场世界杯比赛，并公开预测结果。基于当前的信息，Kimi预测可能要夺冠的是：

德国。

500

聊这个我可就不困了，作为一个战绩可查的资深⋯⋯中国体彩消费者，我对Kimi敢于立Flag的勇气，是深感尊重的。

要知道，从盘口来看，德国的赔率（9.5）并不低，在所有球队里排在第7位，所以Kimi并没有按照最大概率——也就是最稳妥的方案——去做判断，是真有自己的想法的。

当然，即便是选夺冠热门法国、西班牙，赔率（4.5）的风险仍然很高，说白了，早在开幕前就暴论最后的冠军，本身就是一件吃力不讨好的事情。

所以我才要狠夸Kimi的「敞亮」，不光是冠军，Kimi还要对全部104场比赛全都做出公开预测，包括赛后核验以及复盘，一场不落。

这就更硬核了，完全不怕打脸呐⋯⋯（注意，该预测非投注建议、非投资建议、非收益承诺。）

应该无须赘述吧，Kimi这么兴师动众的「Predict In Public」，并非是为了真的去当那个洞悉神谕的预言家，作为一家注重审美和趣味大模型厂商，它是在用一种奇观的形式，向世界演示AI的能力边界和局限性。

· · ·

严格来说，Kimi并没有笃信德国是最有希望夺得这届世界杯的参赛队伍，而是认为德国的市场定价在强队里过于低了。

在使用了8种数学模型——包括SLO评级、Sixon-Coles泊松、XGBoost机器学习、Opta蒙特卡洛模拟等等——对48支球队逐一分析之后，Kimi得出了这么一个结论：

德国的模型预测概率，和市场赔率存在最高的偏差值，达到+3.6pp。

500

什么意思呢？

就是在判断德国是否有机会捧起大力神杯这件事情上，模型比市场多预测了3.6个百分点，所以认定德国，在理性上是回报确定性最高的选择。

就很像量化投资的策略，一家公司好不好并不重要，重要的是它有没有被市场正确定价，一家被高估的好公司，和一家被低估的差公司，显然后者更有买入潜力。

不同的是，量化机构需要雇佣一大票分析师，以及重金采购商业软件，而Kimi靠着几百个Agent昼夜不息的连轴转，自个儿就把整个项目给做完了。

如果不是亲眼所见，我是万万不敢相信的。

所有的细节，都填在了Kimi同时发布的预测报告里，完整版PDF超过200页，量大管饱。

我帮你们看了⋯⋯好吧，是Kimi K2.6帮我帮你们这份报告的重点整理了出来，非常有启发性。

· · ·

报告的作者，是Agent Swarm（集群），这不是一个人名，Kimi把协调多个智能体开会干活的能力，做此称呼。

以及，多个智能体的意思，是上限可达300个。

500

Agent Swarm用来搭建这次预测工程的组织架构，很有意思：

最上层，是战略组，包括总指挥、质检员和核验者，负责最开始的分配资源以及最后的验收结果；中间层，是战术组，这个就比较丰富了，有研究赛程发展的，有归纳历史规律的，有分开算小组赛和淘汰赛的，有对黑马球队留心眼的，整个团队分工明确；最下层，是战场组，主要清洗海量数据，比如球员的伤病、球队的特点、比赛的天气、FIFA的排名等等；

甚至连反方的「工位」都被预留了，专门寻找反例和翻车风险，交叉对比各种冲突，直到得出大多数Agent都认可的结论。

是不是很有五脏俱全的味道？

特别严谨的是，Kimi还对2010年-2022年的4届世界杯做了回溯演练，在只使用目标年份之前的数据训练这个前提下，用这套协作模式进行预测，然后叠加实际赛果，反思自己犯了哪些错误。

有句话真不知道当讲不当讲：硅基生命的态度，可能超过了90%的碳基生物⋯⋯

· · ·

话说回来，预测世界杯，本质上是一门玄学，非人力所能及的不确定性太高了，也并不存在某种原理，只要算准了，就一定能够保证正确。

所以完全不能排除的画面也包括：一顿操作猛如虎，一看战绩零杠五。

500

但俗话说得好，过程好，结果不会差，为结果而忽视过程，结果反而好不起来。

醉翁之意不在酒，在乎山水之间也，而Kimi的山水之间，就是要告诉大家，Vibe Working的时代已经到来了。

根据Gartner的统计口径，全球大概有10亿-13亿知识工作者，占到整个劳动力市场的30%左右，在发达国家甚至能够达到40%以上的占比。

所谓的知识工作，泛指主要通过计算机设备处理各种信息的岗位，包括但不限于写代码、做分析、出报告、设计系统等等，其中的写代码部分，我们都知道已经被Vibe Coding给稳稳接住了。

但毕竟编程只是其中的一个子集，在整个知识工作的范畴里，AI的渗透受阻可以归咎于很多原因，比如不够标准化，或是交付难以验证，但在基座模型的飞速进步下，困难的保质期都不长。

大力出奇迹，一杆可清台。

· · ·

Coding依然很重要，或者说，世界是可被编码的，这本身就是AI得以成立的底层逻辑。

无论是图灵坚信思考是一个工程问题、而非哲学家心中的灵魂之类，还是香农在上世纪五十年代就用人类受试者去玩猜字游戏、用以论证智能始于对信息的预测，所有的历史研究和前沿走向都并轨于同一个共识：

凡事皆可压缩。

当人类知识的总和被压缩到了极致，就能制造一个通晓万物的机器出来，它能通过模拟已经存在过的和还没有发生的所有过程，去得到每一项任务的最优解。

这听起来很科幻，也足以引起事关自由意志的思辨，但我们正确切的走在这条路上，大模型的运行原理就是预测下一个词元，这是众所周知的，香农的遗憾在于他买不到英伟达的GPU。

所以能够理解Kimi为什么要预测世界杯了么？

面对这种长链路、随机性、没有标准答案的复杂目标，如果AI也能完成媲美甚至优于人类表现的任务，那么它在通用性层面的可用，就不再存疑了。

事实上，Kimi已经把同时调度300个Agent分工合作的能力，塞进了客户端里，在新增的Kimi Work模式下，模型已经实现了把数据源、浏览器、本地文件、Excel、PPT、Word 等工作环境串起来，让那300个Agent住进用户的电脑里。

500

而Kimi Work的内核，还是源自Kimi Code编码助手的能力，程序员继续用Coding Agent生成代码，而更广义的知识工作者，则可启用Kimi Work，在桌面上指挥 AI 做调研、分析、自动化和交付物。

· · ·

2010年的世界杯，数以亿计的人类在围观一条名叫保罗的章鱼，用它黏糊糊的触手从闭合的箱子里选择比赛赢家。

16年后，开箱的角色变成了连生物都算不上的AI，从克苏鲁的古神符号，到后现代的赛博朋克，如此交替，本身就充满了隐喻。

隐喻那种不可言说的混沌，让渡给了可被测量的科技。

这让我想起在自己投入了无数个通宵的游戏「文明6」里，解锁信息时代的科技之后，会出现在屏幕上的那句话外音；

「现在天上有31颗卫星在地球上空环绕，不为别的，就为了告诉你便利店怎么走。」

取之于硅，用之于碳，这才是AI正确的打开方式，对不对？

科技举报

阑夕

250篇文章 | 53人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

300个AI「算」出了这届世界杯的冠军？

阑夕
科技互联网博主

阑夕

热点

站务

观察者网评论

2026年十大预测，这些期待是否会发生？

风闻社区小助手_小风

全场景数码消费指南：风闻「数码情报局」邀你当消费裁判！

最近更新的专栏

风闻最热

全部专栏

热门搜索

搜索历史

300个AI「算」出了这届世界杯的冠军 ？

阑夕 科技互联网博主

热点

站务

最近更新的专栏

风闻最热

全部专栏

300个AI「算」出了这届世界杯的冠军？

阑夕
科技互联网博主