文心智能体的乌镇时间,指路AI新十年
秋风飒江南,在一年中最好的光景里,全球互联网科技界又迎来了“乌镇时间”。
走在今年的乌镇,我们最常听到的一个说法是“AI新十年”。从2014年开始,世界互联网大会乌镇峰会已经来到了第十一年,而这恰好也是“下一个十年”新篇章的起点。
今年的乌镇峰会,以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”,全面聚焦AI技术与AI产业发展,回应各方对AI发展与治理的关切。从中不难看出,全球互联网科技界已经达成了这样的共识:未来十年,就是AI新十年。
那么,AI新十年究竟该如何开启?中国科技能否实现AI核心技术领先?能否将AI打造为系统化的创新工程,为社会经济提供源源不断的发展动力?能否让AI普惠千行百业,创造更多可能?
这些问题萦绕在AI新十年的开端,各界正迫不及待地想在乌镇找到答案。
好在,乌镇擅长回答这些问题。11月19日至22日,2024年世界互联网大会乌镇峰会在浙江乌镇举行。其中19日下午,2024世界互联网大会领先科技奖发布,百度文心智能体技术获奖,这是继去年知识增强大语言模型关键技术获奖后,百度大模型技术连续两年获得这一奖项。
活动现场,国家卓越工程师、百度首席技术官王海峰表示:“以大模型为代表的人工智能技术正在引领科技创新和产业变革浪潮,而智能体是当前最能激发大模型潜力的应用方向。文心智能体技术的突破,促进了文心大模型能力全面提升,充分释放大模型潜力,加速应用爆发,比如代码智能体、农民院士智能体、个人助手等。大模型、智能体等技术,将激发更多创新,为社会经济发展带来巨大价值。”
从去年的知识增强到今年的智能体,在大模型时代汹涌而来时,百度始终能够在AI领域拿出核心技术创新。文心大模型,已经成为系统化、持续性完成创新的AI体系,并通过各种方式开枝散叶,走向应用。
如何开启AI新十年?文心智能体的“乌镇时间”或许就是一份答卷。
构建由“核心技术领先-系统化创新机制-普惠行业应用”构成的AI之路,就是文心大模型给AI新十年的答卷。
面向AI时代,我们的第一个问题会是:中国AI能否在核心赛道中实现技术领先?
文心智能体获得领先科技奖,就是这个问题的答案。
智能体(Agent)是指能够感知环境并采取行动以实现目标的代理体。它应该具备自主性、适应性和交互能力,被广泛认为是AI大模型落地的最佳应用形式,备受全球科技界瞩目。
文心智能体得奖的意义在于,其在这样一个拥有全球共识的AI核心赛道中,实现了时效进度、技术深度、应用广度等维度的全面领先。
今年9月,OpenAI 发布了o1大模型。这个模型具有“慢思考”能力,可以处理相对较复杂的推理任务,此后迅速成为全球AI行业的热点,引动了新的AI风潮。
但值得注意的一点是,早在去年10月,百度已经非常具有前瞻性地预判并发布了“慢思考”相关能力,这就是百度的智能体机制。百度提出了“系统2”的技术实现逻辑。相比以内容生成即时性为主导的系统1,系统2的核心思考模型,包括理解、规划、反思和进化。能够做到可靠执行、自我进化,并在一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,并在环境中持续学习、自主进化。
这样的技术思想,引领了此后AI技术的发展趋势。在今年“智能体”“慢思考”等技术观点风靡全球时,百度已经提前进行了预判和布局。
在百度看来,就像一个人的知识和技能终归有限。想要让AI完成复杂任务,也需要多智能体的协作,从而像工业流水线一样增强智能系统的整体效能,提升AI解决复杂问题的能力。
文心智能体技术的突破,促进了文心大模型能力的全面提升。根据IDC、沙利文、中国软件评测中心等多家机构的数据显示,文心大模型超过国际领先大模型平均表现,位居中国第一,国际第一梯队。
多智能体已经有了实际应用。比如,百度秒哒采用了智能体的中心化模式。其中的代码智能体通过场景知识增强,提升了复杂代码生成的质量与稳定性。文心快码则可以在开发全流程中实现多个智能体的流水线协同,大幅提升程序员的工作质量和效率。
可以说,文心智能体不仅提升了文心大模型的能力,升级了百度一系列AI场景。更为整个行业打开了AI技术发展的可能性,为开发者创造了新的开发范式。
文心智能体的前瞻性突破、快速成熟,以及在极短时间内得到广泛应用,背后指向了这样一个内核:文心大模型,已经成为能够系统化、持续性创新的AI飞轮。
而这正是走向AI新十年的真正驱动力。
面向AI时代,我们的第二个问题会是:AI究竟是昙花一现,还是能够持续推动社会经济发展的源动力?
这个问题,我们可能在理论上有无数种解答,但都不如一次实践来得真实可靠。我们会担心AI大模型的创新只是偶然,不可持续,不能系统化发展。但从去年闪耀乌镇的知识增强技术,到今年更加耀眼的文心智能体。我们可以发现文心大模型已经形成了能够系统化创新的AI飞轮。它源源不断完成着AI技术突破,延绵而有力。
在知识增强、智能体之外,文心大模型还有着众多广受业界认可的技术突破,比如最近业界激烈讨论的检索增强。为了消除大模型的幻觉,百度研发了“理解-检索-生成”协同优化的检索增强技术,能够有效提升了模型技术及应用效果。面向不同应用场景的文生图需求,百度还进一步研发了检索增强的文生图技术,既可以生成精确的图片,也可以进行泛化生图。
自去年3月16日发布文心一言以来,文心大模型不断升级。与此同时,知识增强、检索增强、智能体等核心技术也在不断升级。差异化技术与模型推训能力组成了文心大模型的双螺旋结构。技术推动模型效果升级,模型推训效率牵引技术成长。
在这种模式下,文心大模型逐渐构筑出了完整的大模型核心科技体系,以及可持续发展的创新机制。百度能够率先引领AI应用的爆发,这背后得益于文心大模型技术的持续进步以及能力的不断拓展。
AI绝非昙花一现,文心大模型能够连续两年闪耀乌镇就是证明。
面向AI时代,我们的第三个问题会是:AI能否为千行百业带来创造性价值?
这个问题,最佳答案不在技术研究者手中。而在无数企业、开发者手里,在当今社会的每一个角落。AI的价值,只能在应用中寻找,别无他法。
为了让AI应用落地生花,百度打造了文心大模型矩阵。其中包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,从而能够满足不同应用的模型需求。在这背后,文心大模型还与飞桨深度学习平台进行了联合优化,从而极大提升了模型效果、训练效率和推理性能,支撑了文心的应用落地。
在不久之前的百度世界大会2024,王海峰披露了文心加飞桨的最新进展。飞桨文心开发者数量已达1808万,服务了43万家企业,创建了101万个模型。
即使在一些我们耳熟能详的场景里,也能看到文心大模型的落地生花。比如,在国人无比喜爱的国家跳水队。2019年,百度就和中国国家跳水队开展技术合作,研发智能跳水辅助训练系统。这套系统可以自动识别、跟踪、采集、分析每一个跳水动作,对运动员数据进行全面管理与评估,实现高效率科学训练。
奥运冠军全红婵就提到,巴黎奥运会周期自己长高、长重了,做动作的感觉和之前不一样。AI系统可以多角度还原动作,并和之前的动作做对比,从而帮助将动作完成得更好,她认为这套系统“真是太全面了。”
不仅跳水如此,百度还将文心大模型体育解决方案拓展到游泳、攀岩、体操等6支国家队的日常训练。在体育这个以人为本的领域中,文心大模型也已深入参与其中。
在日常生活里,大模型能力也已经深入到方方面面。比如逛科技馆是很多人的爱好,尤其家长喜欢带孩子前往科技馆学习知识。百度世界大会2024期间,中国科学技术馆与百度达成战略合作,联合发布了“科技馆智能体”。“科技馆智能体”基于闪耀乌镇的文心智能体打造,可以为科技馆观众提供基础信息、导览等服务,还能随时为身处各地的青少年解答科学问题,让科普工作穿越信息壁垒与空间界限,用最科技的方式来完成科学普及。
智能体带来的价值不仅融入生活,更能落地生产。在今年6月,被称为“农民院士”的中国工程院朱有勇院士团队与百度合作,打造了首个农业智能体“农民院士智能体”。这一智能体可以把院士“装”到手机里,随时随地为农民答疑解惑。让大模型真正融入生产生活当中,成为新质生产力的源泉。
AI新十年的答卷,是AI应用的落地生花。这些花开在运动员的一堂训练课中,开在一次前往科技馆的路上,开在农田、工厂、银行、实验室,开在AI时代由无尽可能性构成的旷野中。
文心智能体的“乌镇时间”告诉我们,AI之路,前途璀璨。接下来,还有更多值得期待的惊喜。
王海峰说,可以很笃定地告诉大家,文心大模型仍在持续训练中,敬请期待更强大的新版本。
到目前为止,文心一言的用户规模已经达到4.3亿。他们共同为乌镇,为AI,为智能化的科技革命,指路未来新十年。