王凡、刘少山:中国如何引领全球具身智能?DeepSeek的战略启示|AI观察

500

  编者按 ·  2024.02.10

  在人工智能领域的迅猛发展浪潮中,一个名为DeepSeek的新兴AI大模型应用异军突起,以超乎想象的速度跃居全球科技舞台的中心。在极短的时间内,其每日活跃用户数量便超越了先前的热门平台ChatGPT,并在此后的日子里持续激增,成功触及2000万日活跃用户的里程碑,彰显了惊人的成长动能。

  这一非凡成就不仅令OpenAI与NVIDIA等业界巨头深感惊讶,同时也激起了国内AI企业的热烈反响。阿里云、腾讯云等国内科技领军企业迅速表态,宣布对DeepSeek提供支持,此举标志着中国AI企业在全球范围内的竞争力迈上了一个崭新的台阶。

500

  AI大模型应用Deepseek(图源:经济参政报)

  本文通过借鉴DeepSeek的发展经验,探讨中国如何构建自主创新、开源、可落地的具身智能技术路线,并引领全球发展。DeepSeek通过自主创新和开源,不仅提升了中国在AI领域的技术独立性,也推动了产业升级,增强了中国在国际AI竞争中的发展信心。沿着这一思路,未来我国具身智能的发展需要具备几个关键特征:开源、可落地、适应多个应用场景,并能够成为国际标准的基础模型。最近发布的具身智能开源项目OmniRL突破了上下文强化学习的上限,展示了上下文强化学习这一技术路线的可行性。作为开源项目,OmniRL展现了可赋能多个产业的巨大潜力。与DeepSeek类似,OmniRL为中国在全球具身智能标准的制定中提供了技术支持,帮助中国在国际AI竞争中占据有利位置。

  DeepSeek的突破

  对具身智能的启示

  最近,DeepSeek的横空出世让人们看到了中国在通用人工智能(AGI)领域突破技术壁垒、摆脱国际依赖、构建本土生态的巨大潜力。作为一家专注于AGI研发的公司,DeepSeek在自然语言的复杂推理训练上取得关键性突破,打破了长期以来西方科技巨头在大模型领域的垄断格局。DeepSeek的成功不仅推动了中国AI产业的自主创新,还在国家安全、国际竞争、数据主权等方面提供了战略支撑,使中国在全球AI竞赛中占据了重要地位。

  然而,DeepSeek的变革局限于语言智能领域,人工智能的终极目标不仅仅是处理文本、生成语言,而是具备理解、推理、决策和执行的能力,能够在复杂的物理世界中自主学习并适应变化。真正的通用智能需要超越语言模型,迈向具身智能(Embodied AI)。具身智能不仅需要理解世界,还要能够在物理世界中感知、决策并行动,具备自适应能力,在不断变化的环境中自主学习。如何构建具备通用学习能力的具身智能,将成为下一代人工智能发展的关键。

  DeepSeek:

  推动中国AGI领域自主创新

  DeepSeek的崛起代表了中国在大语言模型领域的一次重要突破。它不仅在技术层面挑战了国际科技巨头,也在战略层面打破了中国对西方技术的依赖。DeepSeek推出的大模型(如DeepSeek-R1)在自然语言的复杂推理中展现了卓越的性能,特别是在中文语境下,部分表现甚至优于国际竞品。这一技术突破标志着中国在AGI领域的崛起,打破了过去在关键技术领域的依赖局面。

  DeepSeek在产业升级方面也作出了重要贡献。通过自主研发底层框架和训练方法,DeepSeek不仅降低了中国在人工智能技术上的外部依赖,还推动了中国AI产业的全面升级。现在DeepSeek的技术已经深度渗透到金融、医疗、教育、制造等多个行业,赋能这些行业的数字化转型并提升效率。以金融领域为例,DeepSeek的模型在金融风控中提供了更精准的数据分析,帮助企业更好地预测风险并做出决策。

  在国际竞争中,DeepSeek增强了中国在全球AI话语权争夺中的筹码。随着中国在人工智能领域的崛起,DeepSeek让中国能够与美欧等科技大国平起平坐。通过技术输出、开源模型等方式,DeepSeek为中国争取到了在AI伦理、安全等领域的更多话语权,逐步扭转了国际AI标准长期由西方主导的局面。

500

  2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕(图源:新华社)

  具身智能:人工智能

  从虚拟世界走向物理世界

  尽管DeepSeek在语言智能领域取得了突破,但人工智能的终极目标远不止于此。具身智能是下一阶段发展的关键,它的目标是让人工智能不仅局限于基于共性知识的信息处理和语言推理,还能够像人类一样感知和适应陌生环境,理解新任务,并做出自主决策。具身智能的挑战在于如何让AI具备理解、感知、推理、决策和执行的能力,同时能够在复杂、多变和非共性的物理环境中自主学习并适应新的任务。

  例如,工业机器人不仅需要理解不断调整的生产任务,还需要在变化环境中持续改进技能;自动驾驶系统不仅要处理一些常识范围内的问题,还需要处理长尾的,超越共性知识的复杂突发问题,这也正是目前自动驾驶落地最大瓶颈之一。因此,具身智能要求AI系统具备比语言模型更高的复杂度,包括本体异构、长时记忆、实时决策和实时自主学习。当前的强化学习方法虽然在多个领域取得了成功,但在具身智能的实现过程中仍然面临许多挑战。传统强化学习方法依赖大量的训练数据,并且通常只能在固定任务环境下进行学习,缺乏对未知任务的泛化能力。同时,传统模型往往依赖梯度优化,导致它们在任务切换时容易发生“灾难性遗忘”,无法像人类一样进行终身学习。要突破具身智能的瓶颈,必须构建出既能适应当前任务又能在新环境中进行自我进化的智能体。500

  上下文强化学习:

  具身智能的发展方向

  随着具身智能的不断发展,上下文强化学习(In-Context Reinforcement Learning, ICRL)为这一领域提供了新的研究方向。传统的强化学习方法通常依赖于特定环境中训练好的策略,这些策略对于任务和环境变化的适应能力较差,限制了智能体的泛化能力。在面对新任务或变化环境时,传统强化学习方法往往需要重新进行大量训练,而不能像人类一样快速适应。

  上下文强化学习正是为了解决这一问题。ICRL通过结合上下文信息(如环境的动态变化或外部输入)来调整学习策略,使得智能体能够更加灵活地应对任务变化和环境的不确定性。这种方法不仅可以在已知环境中优化策略,还能在新的、未知的环境中迅速调整和学习,而无需从头开始训练。在具身智能的背景下,上下文强化学习能够帮助智能体在多样的物理环境中做出适应性决策,增强了智能体的灵活性和自主学习能力。

500

  智能素描设备,该设备可通过现场拍摄画出素描图(图源:新华社)

  OmniRL进一步突破了上下文强化学习效果和泛化能力的上限。 OmniRL基于马尔可夫决策链假设生成产生了百万级别的环境和任务,以及百亿时间步的强化学习过程数据。利用大规模元训练(Meta-training)方法,OmniRL使智能体不再只针对特定任务或一类任务,而是学会在广泛任务中“如何学习”的能力,突破了传统强化学习方法的限制。这使得OmniRL能够以很好的表现适应完全没有训练过的强化学习任务。

  OmniRL另外一个核心贡献是证明了任务多样性而不是数据量对于智能体学习能力的重要性。OmniRL证明随着任务数量增加,模型能够从掌握任务本身,转变为掌握更 “如何学习”的能力,这种能力对比前者泛化性更强。同时还证明了,这种自主学习能力,对于上下文长度会提出更高要求,从根源上证明了长序列推理的重要性。为了区分以掌握任务本身为目标的“预训练”方法,OmniRL凸显了以“如何学习”为目标而不以掌握具体任务为目标的“元训练”的潜力。

  OmniRL采用的大规模高效线性注意力机制,提升了模型在长序列任务中的表现和长期记忆能力,使得智能体能够像人类一样在长期交互过程中进行学习,并具备更强的环境适应性。

  尽管OmniRL在研究领域中展现出较高的潜力,但它仍处于探索阶段,尚未实现大规模应用。我们应当保持谨慎态度,认识到具身智能的成熟仍需要克服诸多技术挑战,特别是在复杂高维系统、本体异构、实时决策等方面。500

  具身智能的应用前景

  与行业变革

  具身智能的广泛应用将带来深刻的行业变革,特别是在智能制造、自动驾驶、智能医疗等领域。具身智能能够使工业机器人在生产线自主适应不同任务,提升生产线的柔性化程度,减少对人工干预的依赖。例如,在自动驾驶领域,OmniRL的自主学习能力将有助于系统适应全新的交通规则,陌生的室外和停车场环境,以及完全不同的硬件条件。在智能医疗领域,具身智能可以辅助医生针对个体病患提供长期跟踪的,精准的个性化健康管理服务。

  此外,具身智能将在教育、物流、农业等多个行业带来革命性的变革。它不仅提升了生产力和效率,还能够改变传统行业的运作模式,推动产业升级和新经济模式的形成。通过具身智能的应用,企业能够实现更加智能的自动化生产,提供更加高效的个性化医疗方案,以及更灵活的城市交通管理。

500

  登上蛇年春晚舞台的人形机器人宇树H1“福兮”(图源:新华社)

  政策建议:开源发展、标准化

  和产业化落地

  随着全球对具身智能技术的日益关注,中国在这一领域的加速发展需要政策层面的强力支持。为确保中国在全球AI竞争中的领先地位,政策可以从以下三个方面着手,推动具身智能的技术突破、产业化应用和社会融合。

  一是支持开源发展,促进技术创新和全球合作:开源是加速具身智能技术创新的关键。政府应鼓励科研机构和企业积极参与具身智能的开源项目,推动核心技术、算法和平台的共享与合作。通过资助开源平台建设和资源共享,政府能促进技术创新、降低研发成本,并增强中国在全球AI开源社区的影响力。

  二是制定具身智能标准,确保技术可控性和安全性:具身智能的快速发展离不开标准化的引导。政府应主导制定符合中国需求的具身智能技术标准,以涵盖数据安全、伦理规范和行业应用等方面。这不仅能保证技术的可控性、可靠性和安全性,还能增强中国在国际标准化工作中的话语权,推动全球技术竞争中占据主动地位。

  三是推动具身智能的产业化应用:政府应通过专项资金支持和税收优惠政策,推动具身智能技术在智能制造、医疗健康、自动驾驶等行业的应用落地。通过设立示范基地和产业园区,加速技术从实验室到市场的转化。同时,应鼓励跨行业合作,推动实际应用的试点和商业化,帮助企业降低技术应用的风险和成本。500

  结论:把握技术机遇,

  领导未来的全球AI竞争

  推动各行业发展的核心驱动力。政策制定者应当高度关注具身智能的发展趋势,抓住这一战略机遇,加速技术的进一步突破和产业化应用,确保中国在全球人工智能竞赛中的长期领先地位。

  未来,具身智能的广泛应用不仅将改变人类的工作和生活方式,还会成为全球科技竞争中的新方向,推动人工智能技术发展进入一个全新的时代。

  本文作者

  王凡:现任深圳市人工智能与机器人研究院(AIRS)具身智能中心研究员,在人工智能产业和研究方向上有超过15年经验,曾获得吴文俊人工智能科技进步奖特等奖。

  刘少山:现任深圳市人工智能与机器人研究院(AIRS)具身智能中心主任,ACM科技政策委员会成员、IEEE国际设备和系统路线图(IRDS)机器人计算方向主席。研究方向为具身智能、计算系统、科技政策。

  *免责声明:本文所阐述观点仅代表作者本人立场,不代表大湾区评论或IIA机构立场。

  *原创声明:本文版权归微信订阅号“大湾区评论”所有,未经允许任何单位或个人不得转载、复制或以任何其他方式使用本文部分或全部内容,侵权必究。公众号授权事宜请直接于文章下方留言,其他授权事宜请联系IIA-paper@cuhk.edu.cn。

  GBA Review 新传媒

  校对 | 朱胤霖 

  排版 | 许梓烽 

  初审 | 杨芸淞 

  终审 | 冯箫凝

  

站务

最近更新的专栏

全部专栏