文心智能体的乌镇时间，指路AI新十年

脑极体
脑极体官方账号

从技术协同到产业革命，从智能密钥到已知尽头昨天 23:53

秋风飒江南，在一年中最好的光景里，全球互联网科技界又迎来了“乌镇时间”。

走在今年的乌镇，我们最常听到的一个说法是“AI新十年”。从2014年开始，世界互联网大会乌镇峰会已经来到了第十一年，而这恰好也是“下一个十年”新篇章的起点。

今年的乌镇峰会，以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”，全面聚焦AI技术与AI产业发展，回应各方对AI发展与治理的关切。从中不难看出，全球互联网科技界已经达成了这样的共识：未来十年，就是AI新十年。

那么，AI新十年究竟该如何开启？中国科技能否实现AI核心技术领先？能否将AI打造为系统化的创新工程，为社会经济提供源源不断的发展动力？能否让AI普惠千行百业，创造更多可能？

这些问题萦绕在AI新十年的开端，各界正迫不及待地想在乌镇找到答案。

好在，乌镇擅长回答这些问题。11月19日至22日，2024年世界互联网大会乌镇峰会在浙江乌镇举行。其中19日下午，2024世界互联网大会领先科技奖发布，百度文心智能体技术获奖，这是继去年知识增强大语言模型关键技术获奖后，百度大模型技术连续两年获得这一奖项。

活动现场，国家卓越工程师、百度首席技术官王海峰表示：“以大模型为代表的人工智能技术正在引领科技创新和产业变革浪潮，而智能体是当前最能激发大模型潜力的应用方向。文心智能体技术的突破，促进了文心大模型能力全面提升，充分释放大模型潜力，加速应用爆发，比如代码智能体、农民院士智能体、个人助手等。大模型、智能体等技术，将激发更多创新，为社会经济发展带来巨大价值。”

从去年的知识增强到今年的智能体，在大模型时代汹涌而来时，百度始终能够在AI领域拿出核心技术创新。文心大模型，已经成为系统化、持续性完成创新的AI体系，并通过各种方式开枝散叶，走向应用。

如何开启AI新十年？文心智能体的“乌镇时间”或许就是一份答卷。

构建由“核心技术领先－系统化创新机制－普惠行业应用”构成的AI之路，就是文心大模型给AI新十年的答卷。

面向AI时代，我们的第一个问题会是：中国AI能否在核心赛道中实现技术领先？

文心智能体获得领先科技奖，就是这个问题的答案。

智能体（Agent）是指能够感知环境并采取行动以实现目标的代理体。它应该具备自主性、适应性和交互能力，被广泛认为是AI大模型落地的最佳应用形式，备受全球科技界瞩目。

文心智能体得奖的意义在于，其在这样一个拥有全球共识的AI核心赛道中，实现了时效进度、技术深度、应用广度等维度的全面领先。

今年9月，OpenAI 发布了o1大模型。这个模型具有“慢思考”能力，可以处理相对较复杂的推理任务，此后迅速成为全球AI行业的热点，引动了新的AI风潮。

但值得注意的一点是，早在去年10月，百度已经非常具有前瞻性地预判并发布了“慢思考”相关能力，这就是百度的智能体机制。百度提出了“系统2”的技术实现逻辑。相比以内容生成即时性为主导的系统1，系统2的核心思考模型，包括理解、规划、反思和进化。能够做到可靠执行、自我进化，并在一定程度上将思考过程白盒化，从而让机器像人一样思考和行动，自主完成复杂任务，并在环境中持续学习、自主进化。

这样的技术思想，引领了此后AI技术的发展趋势。在今年“智能体”“慢思考”等技术观点风靡全球时，百度已经提前进行了预判和布局。

在百度看来，就像一个人的知识和技能终归有限。想要让AI完成复杂任务，也需要多智能体的协作，从而像工业流水线一样增强智能系统的整体效能，提升AI解决复杂问题的能力。

文心智能体技术的突破，促进了文心大模型能力的全面提升。根据IDC、沙利文、中国软件评测中心等多家机构的数据显示，文心大模型超过国际领先大模型平均表现，位居中国第一，国际第一梯队。

多智能体已经有了实际应用。比如，百度秒哒采用了智能体的中心化模式。其中的代码智能体通过场景知识增强，提升了复杂代码生成的质量与稳定性。文心快码则可以在开发全流程中实现多个智能体的流水线协同，大幅提升程序员的工作质量和效率。

可以说，文心智能体不仅提升了文心大模型的能力，升级了百度一系列AI场景。更为整个行业打开了AI技术发展的可能性，为开发者创造了新的开发范式。

文心智能体的前瞻性突破、快速成熟，以及在极短时间内得到广泛应用，背后指向了这样一个内核：文心大模型，已经成为能够系统化、持续性创新的AI飞轮。

而这正是走向AI新十年的真正驱动力。

面向AI时代，我们的第二个问题会是：AI究竟是昙花一现，还是能够持续推动社会经济发展的源动力？

这个问题，我们可能在理论上有无数种解答，但都不如一次实践来得真实可靠。我们会担心AI大模型的创新只是偶然，不可持续，不能系统化发展。但从去年闪耀乌镇的知识增强技术，到今年更加耀眼的文心智能体。我们可以发现文心大模型已经形成了能够系统化创新的AI飞轮。它源源不断完成着AI技术突破，延绵而有力。

在知识增强、智能体之外，文心大模型还有着众多广受业界认可的技术突破，比如最近业界激烈讨论的检索增强。为了消除大模型的幻觉，百度研发了“理解－检索－生成”协同优化的检索增强技术，能够有效提升了模型技术及应用效果。面向不同应用场景的文生图需求，百度还进一步研发了检索增强的文生图技术，既可以生成精确的图片，也可以进行泛化生图。

自去年3月16日发布文心一言以来，文心大模型不断升级。与此同时，知识增强、检索增强、智能体等核心技术也在不断升级。差异化技术与模型推训能力组成了文心大模型的双螺旋结构。技术推动模型效果升级，模型推训效率牵引技术成长。

在这种模式下，文心大模型逐渐构筑出了完整的大模型核心科技体系，以及可持续发展的创新机制。百度能够率先引领AI应用的爆发，这背后得益于文心大模型技术的持续进步以及能力的不断拓展。

AI绝非昙花一现，文心大模型能够连续两年闪耀乌镇就是证明。

面向AI时代，我们的第三个问题会是：AI能否为千行百业带来创造性价值？

这个问题，最佳答案不在技术研究者手中。而在无数企业、开发者手里，在当今社会的每一个角落。AI的价值，只能在应用中寻找，别无他法。

为了让AI应用落地生花，百度打造了文心大模型矩阵。其中包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型，以及基于基础模型生产的系列思考模型和场景模型，从而能够满足不同应用的模型需求。在这背后，文心大模型还与飞桨深度学习平台进行了联合优化，从而极大提升了模型效果、训练效率和推理性能，支撑了文心的应用落地。

在不久之前的百度世界大会2024，王海峰披露了文心加飞桨的最新进展。飞桨文心开发者数量已达1808万，服务了43万家企业，创建了101万个模型。

即使在一些我们耳熟能详的场景里，也能看到文心大模型的落地生花。比如，在国人无比喜爱的国家跳水队。2019年，百度就和中国国家跳水队开展技术合作，研发智能跳水辅助训练系统。这套系统可以自动识别、跟踪、采集、分析每一个跳水动作，对运动员数据进行全面管理与评估，实现高效率科学训练。

奥运冠军全红婵就提到，巴黎奥运会周期自己长高、长重了，做动作的感觉和之前不一样。AI系统可以多角度还原动作，并和之前的动作做对比，从而帮助将动作完成得更好，她认为这套系统“真是太全面了。”

不仅跳水如此，百度还将文心大模型体育解决方案拓展到游泳、攀岩、体操等6支国家队的日常训练。在体育这个以人为本的领域中，文心大模型也已深入参与其中。

在日常生活里，大模型能力也已经深入到方方面面。比如逛科技馆是很多人的爱好，尤其家长喜欢带孩子前往科技馆学习知识。百度世界大会2024期间，中国科学技术馆与百度达成战略合作，联合发布了“科技馆智能体”。“科技馆智能体”基于闪耀乌镇的文心智能体打造，可以为科技馆观众提供基础信息、导览等服务，还能随时为身处各地的青少年解答科学问题，让科普工作穿越信息壁垒与空间界限，用最科技的方式来完成科学普及。