月面机器人生态圈超级自动化实现方法研究

来源:中国航天

丁瑜 郝立松 桑孜良 刘红卫(通信作者)

军事科学院国防科技创新研究院

在月球表面极端环境的限制下,人类无法长驻月面进行探测活动,而单一的月面机器人能力较为有限,且地面远程操控会产生延时,难以满足月面多任务、高可靠的探测需求。目前的机器人集群虽然在各个领域得到了广泛应用,但仍需要人类的持续维持和物质能量供应,无法在月面环境中长期独立运作。随着人工智能(AI)技术的飞速发展,机器人技术也迎来了前所未有的革新。AI赋予机器人感知、理解和适应复杂环境的能力,使其能够执行多样化的任务,并且在未知的动态环境中自我学习和进化。

自然生态系统具有自组织、自适应和自演化特性,可以将这种自然界的体系移植到机器人技术中,通过构建一个由多种机器人组成的生态系统,形成分工合作、相互依存的关系,从而实现类似自然生态系统的自给自足和自我调节,形成高度协同的机器人生态圈,在月面自主开展基础设施建设、资源开采、科学研究等活动。

一、

机器人生态圈的科学概念

机器人生态圈的科学概念 机器人生态圈系统代表了一种高度智能化、自给自足的具身智能技术体系,它借鉴了自然界生态系统的原理,通过机器人技术的深度融合,实现了复杂任务的自主执行与环境适应性,旨在创建一个能够不依赖人类直接干预,独立在复杂或极端环境中运作、发展和执行任务的机器人集群。  

机器人生态圈包括多个子系统,环境支持类子系统负责提供机器人生态圈内所有子系统运行所需的基础条件,包括能源供给、环境信息感知、信息通信、导航定位、作业庇护、原料与零件供应;自维持类机器人子系统负责确保生态圈内机器人和设备的持续有效运行,通过故障检测、维修、能源补给、废料处理等操作,维持整个系统在无人环境下的稳定状态;自复制类机器人子系统能够根据需要生产与现有机器人结构、形态和功能一致的新一代机器人,实现机器人数量的指数级增长,以应对损耗或任务扩展需求;自进化类机器人子系统通过模仿生物进化原理,对机器人软件和硬件进行迭代升级,以适应环境变化和任务更新,提升整个生态圈的适应性和效能;任务管理与控制类机器人子系统是系统中枢,负责任务的决策、协调、控制与反馈,确保所有任务的有效执行,基于时间、位置、环境等全局信息做出最优决策;任务执行类机器人子系统是根据不同任务场景和目标,执行具体任务操作。

二、

月面机器人生态圈超级自动化实现方法

(一)月面机器人生态圈的超级自动化技术体系

月面机器人生态圈超级自动化主要分为3个部分,分别是人形机器人在物理域上实现智能自动化、软件机器人在信息域上实现智能自动化、多模态大模型在认知域上实现智能自动化,三者在机器人生态圈中存在着紧密而相互依存的关系:人形机器人在物理域上的智能自动化为机器人提供了执行物理任务的能力;软件机器人在信息域上的智能自动化则负责数据处理和业务优化;多模态大模型在认知域上的智能自动化提升了机器人的交互能力和智能水平。三者相互补充、协同工作,共同构成了机器人生态圈中的智能自动化体系,如图1所示。

500

图1 月面机器人生态圈超自动化运行模式  

在物理域上,人形机器人具备高度灵活的运动能力,以及与人类相似的环境交互能力,能够在复杂多变的环境中自如地行走、抓取和操作物体。同时,人形机器人具备与人类相似的感知能力,能够通过传感器技术感知周围环境信息,并通过深度学习等算法进行数据处理和决策判断,从而做出更加智能和自主的行动。与月面常用的轮式、履带式及四足机器人相比,人形机器人在月面任务中具备独特优势,其类人肢体结构与多自由度关节设计,能灵活适配陨石坑、岩石堆等非结构化地形,且可直接复用人类设计的月面操作工具,高效完成精细作业。但同时也存在明显短板:相较于轮式机器人的高速移动能力、履带式机器人的强负载特性及四足机器人的稳定越障性能,人形机器人双足行走模式在低重力环境下平衡控制难度更高,能耗显著增加,且复杂的机械结构易受月尘侵蚀、温差影响,导致维护成本上升与可靠性风险提升,需通过针对性的结构优化与控制算法改进加以平衡。  

在信息域上,软件机器人具备大规模数据处理能力、智能学习与自适应能力,以及高度的模块化与集成性,可以提高数据处理的速度和准确性,结合人工智能算法,使其能够在不断变化的环境中自主学习和适应。  

在认知域上,多模态大模型能够处理并融合文本、图像、声音和视频等多种类型的数据,实现对真实世界的全面理解,不断提升机器人生态圈的整体算力和优化算法,确保模型的准确性和效率,使决策更加准确。  

(二)人形机器人在物理域上实现智能自动化 

人形机器人是一种能够模仿人类运动动作,且外观与人体相似的机器人,并具有一定程度的认知和决策智能。人形机器人建立在多学科基础之上,集人工智能、高端制造、新材料等先进技术于一体,实现类人的功能。由于月球表面的微重力特性,机械臂会因刚度低导致控制精度下降,末端最大控制偏差达35mm,可对机器人采用刚度建模方式,将误差降低至1mm内。月尘带电易附着,且较为锋利,容易使机器人机械结构损坏,可采用带有微纳起伏结构的涂层材料自清洁月尘。月面中的强辐射可诱发电子元件单粒子翻转,将辐射屏蔽材料加入硅胶中作为涂层,可以在不影响机器人运动的情况下实现辐射防护。月面近300℃的昼夜温差会破坏材料的结构完整性和性能,可将精密零部件集成在一体化密封舱内,通过传导路径散热,并增加隔热层材料减少与低温月壤的热交换。  

月球的低重力环境和陨石坑遍布的非结构化地形给人形机器人的性能带来了挑战。针对此类问题,可考虑月壤的接触力和重力,在特定月球环境中设计鲁棒控制算法,使机械腿能够平稳行走。采用相同支链构型的四足月基装备设计分析方法与连续步态规划方案,实现其在月面水平环境下连续稳定行走。在能耗效率上,通过轻量化结构设计降低机械负载,同时选用抗磨损的高稳定性材料,结合结构冗余设计,提高机械可靠性,保障持续运行能力。  

在机器人生态圈中,人形机器人可以通过深度感知、智能决策、实时交互等任务能力,实现机器人生物圈物理域上的互联,确保机器人生物圈在非结构化环境中自主运行,灵活适应环境变化。同时可以通过遗传算法和模型的优化及软硬件的协同进化,不断提升群体性能。人形机器人在月面机器人生态圈中的应用如图2所示。

500

   图2 人形机器人在月面机器人生态圈的应用 

1.环境感知  

人形机器人对周围环境及自身状态具有高度敏锐的感知能力,能够感知非结构化场景,并根据不同的情况做出相应的反应。通过多模态感知系统,人形机器人可以获取视觉、听觉、触觉、嗅觉等多种信息,实现对环境的全方位感知。在机器人生态圈中,机器人可利用视觉传感器、声音传感器、温度传感器等多种传感器实现对环境及其他设备的全面感知,例如,故障检测机器人可以判断机器人及其他设备的健康状况,为是否需要故障维修提供重要依据。 

2.智能决策  

人形机器人基于环境感知获取的信息,可以通过人工智能技术进行智能决策,使机器人能够适应不同环境和任务需求,在各种情况下做出合理且高效的决策,提高工作效率和准确性。在机器人生态圈中,人形机器人可以对各种可能出现的状态进行预测分析并采取行动。任务管理和控制类机器人子系统和任务执行类机器人子系统在处理具体任务场景时,任务决策机器人判断现场态势,任务协调机器人输出指令并由任务控制机器人落实,最后通过任务执行类机器人具体执行指令,各功能单元密切配合,达到综合效益最大化。 

3.任务执行  

人形机器人具备多自由度关节,依托模块化执行系统与自适应控制技术实现对不同形态目标的精细操作。在机器人生态圈中,人形机器人能够利用结构优势,完成多样化任务。在月球土壤采样任务中,可以通过末端执行器搭载的分层采样工具,控制下钻力度与深度进行分层采集,避免对样本造成破坏。在设备部署场景中,人形机器人可利用多关节手臂的灵活运动,在凹凸不平的月面地形中调整设备姿态,将设备平稳固定至预设安装点位。 

4.遗传进化  

人形机器人可以借助深度学习技术,不断提高自己的语言处理能力和语义理解能力,优化自己的算法和模型,可以像人类一样,通过训练来掌握新的知识和技能,实现自身的智能进化。在机器人生态圈中,自进化类机器人子系统通过模仿生物界的遗传与进化功能,使生态圈内的机器人在复制过程中,产生机器人的基因重组与变异,并产生新的幼体机器人,幼体机器人经过学习阶段后,成长为成熟机器人,在这一过程中,通过环境或任务评价系统对经过变异后的机器人进行选择,能更好满足任务需求的机器人将得以保存,能够使机器人生态系统做到独立生存和发展,不依赖于人类支持而完成各项任务。  

(三)软件机器人在信息域上实现智能自动化

机器人流程自动化(RPA)是一种自动化技术,包括感知器、控制器、执行器三部分,如图3所示。它以软件机器人为虚拟劳动力,模仿人类在信息系统上进行界面、控件、数据等要素的感知,开展决策与控制,并通过键鼠模拟操作、智能业务流程管理、工作流自动化等实现信息系统上的自动化操作。从技术发展进程看,当前处于基于规则的软件机器人发展阶段,根据事先定义好的流程完成重复性、高频率的操作任务,并在多个应用程序之间切换,执行表单填写、捕捉数据、文档识别等多种类型的任务,能够全天候不间断地工作,具有高效率、低错误率的优点。随着人工智能技术的不断进步,软件机器人技术将吸纳、融合更多的智能算法。与面向物理域机器人的“具身智能”相对应,将面向信息域软件机器人的人工智能称为“数身智能”。“数身智能”主要通过研究软件机器人的数字形态及其产生的动作与外部环境交互时,软件机器人的感知、决策、执行等行为与外部环境的作用机理及实现方法,来提升软件机器人模拟人类智能行为的能力。未来,数身智能软件机器人发展将融入更多的人工生命特征,我们称之为类生命软件机器人,它是一种高级的软件机器人,通过引入人工生命的基本原理与方法,构建在信息域上具备自复制、自维持、自进化等类生命特征的系统,形成可以自主生存与发展的“数字生命体”。   

500

图3 软件机器人组成部分 

RPA可构建地月协同反馈体系,将机器人自进化后的设计参数、性能数据实时回传地面,结合AI监测模型持续追踪进化轨迹,及时修正偏离方向。同时,在机器人硬件与软件层面嵌入紧急终止模块,预设多重触发条件,当监测到进化行为超出安全边界、出现异常复制或任务逻辑冲突时,可通过地面远程指令或系统自主判定启动终止程序,快速切断危险操作流程。搭配权限分级与操作日志留存机制,实现进化过程可追溯、风险可预判,确保自进化功能在可控范围内发挥作用。  

在机器人生态圈系统中,类生命软件机器人可以通过自动化信息处理、资源调度和任务执行等流程,增强生态圈内各子系统间的智能协同与分工合作,确保整个机器人集群能够自我维持、自我进化、自我复制,并执行复杂任务,促进整个系统的智能自动化和高效运作。类生命软件机器人在月面机器人生态圈的作用如下。 

1.自动化数据集成  

软件机器人可以跨越不同的应用程序和数据库系统,自动执行数据检索、输入和处理任务。在机器人生态圈系统中,类生命软件机器人可以持续收集生态圈的各项运行数据并存入数据库,并自复制多个软件机器人,将分散在不同系统中的数据整合起来,形成一个统一的数据视图,打破信息孤岛。同时,利用类生命软件机器人对收集到的数据进行清洗,去除无效、冗余及错误的信息,构建高度集成、高效的数据流动网络,能够便于机器人生态圈中各部分系统的取用,促进不同子系统之间的通信协作,提升整体的自动化水平和任务执行效率。 

2.任务流程标准化  

类生命软件机器人可以将复杂的任务执行流程分解成多个步骤,利用预先封装好的功能模块,通过标准化的工作流将功能模块串联起来,编排成端到端的自动化流程。在机器人生态圈中,类生命软件机器人可以构建各任务场景的工作流,并自学习任务状态的反馈,自适应地调整工作流中的参数和执行模式,确保生态圈系统的标准化持续运行。例如,自维持机器人子系统中的故障修复场景,需要进行故障检测、故障分类、修复策略规划、零件准备、修复执行、测试验证、废料清理等步骤,可以利用类生命软件机器人构建完整的自动化工作流,更加灵活地适应不同的任务执行场景。 

3.任务协调与调度  

类生命软件机器人可以创建一个任务队列,包含不同来源的待处理任务列表,当任务进入队列时,自动解析任务的详细信息,根据任务的紧急程度、重要性及与其他任务的依赖关系来分析任务的优先级,确保任务按照正确的顺序执行。在复杂多变的任务环境下,类生命软件机器人能够自学习,并基于对任务目标、资源状况、环境条件的综合分析,自进化出最优的任务执行方案,并且在任务执行过程中,根据实时反馈自适应地改进算法,对任务规划进行动态调整,保障任务高效完成。  

(四)多模态大模型在认知域上实现智能自动化 

多模态大模型是一种通过大量参数训练的人工智能模型,它能够处理和整合来自不同模态的数据,以实现更全面和更深入的信息理解,处理更加复杂的任务,如跨模态检索、图像描述生成、视频理解等。  

在机器人生态圈中,多模态大模型充当着认知自动化的核心,它能够整合环境感知、任务执行、自我维持等多个子系统的数据,实现对环境的深度理解、任务的智能决策、机器人群体的高效管理、生态圈中的群体智能提升。由于月面星载算力受限,需通过分层量化、跨模态蒸馏等技术实现模型轻量化,在可控性能损失下压缩参数量以适配载荷能力;同时月面通信链路不稳定,需结合边缘计算降低传输需求。数据安全方面,采用天基联邦学习模式,仅传输更新的模型梯度而非原始数据,兼顾协作与隐私保护。多模态信息的融合使得模型能够做出更全面、更准确的判断,推动了机器人在认知域上的智能自动化,通过统一的理解和规划,使机器人生态圈具备更高的自主性和智能水平,如图4所示。多模态大模型在月面机器人生态圈的作用如下。  

500

图4 多模态大模型示意图  

1.多模态理解  

多模态大模型具有一定的视觉理解能力,还能够处理和理解音频数据,实现跨模态的理解,形成一个更全面的感知,从而更准确地识别环境状态。在机器人生态圈系统中,多模态大模型可以将多种传感器的数据融合,分析摄像头捕捉的图像和视频流,识别地形、障碍物、目标物体和其他机器人;分析环境声音,如风声、动物叫声或机器声,以监测异常情况或特定事件;通过触觉传感器感知物理接触和压力,有助于机器人在执行任务时避免碰撞和损坏。通过跨模态的关联推理,模型可以填补单一模态信息的不足,增强整体的感知精度和鲁棒性,为机器人生态圈的自我维持、环境适应、任务执行等奠定了基础。 

2.情境推演  

多模态大模型能够利用文本、图像、视频、音频等多种类型的数据,理解和推断复杂的情境,结合数字孪生技术,可以创造出更加真实的仿真环境,在各类条件下进行情境推演,便于找出最佳方案。在机器人生态圈中,多模态大模型可以结合数字孪生技术辅助推理,通过输入生态系统中收集的各项数据,包括环境信息、能源状态、机器人健康状况、任务执行进度等,构建一个接近真实环境的虚拟的机器人生态圈。设定不同的初始条件和边界条件,模拟该情境下生态圈的动态反应,利用多次情境模拟以优化决策,识别出最有利的环境设置,可以极大地减少对物理实验的依赖,降低了成本和时间消耗,为实现高效的机器人生态圈治理提供强有力的支持。  

3.任务决策  

多模态大模型能够基于不同模态的输入数据,将其转化为内部可处理的形式,确保不同模态之间的信息能够被有效关联和理解,通过识别实体、理解语境、请求分析等方式,理解背景、时间、条件、事件等输入数据的含义,构建关于当前情境的综合理解,以便在特定情境下作出恰当的决策。在机器人生态圈中,多模态大模型能够综合考虑生态圈环境、机器人状态、能源储备等条件,在特定任务情景下做出全面、合理的决策。大模型融合生态圈的多种数据源能够基于历史数据和当前信息,对事件进行分析和决策,例如,在自维持机器人子系统的能源管理场景下,大模型能够预测能源需求高峰,调整能源存储的告警阈值,提前下达能源采集的指令,应对能源不足的问题。多模态大模型的任务决策能力能够贯穿机器人生态圈运行的全过程,确保生态圈系统能够独立生存、发展,并高效执行各种任务。  

4.自我进化  

多模态大模型具有强大的自主学习能力,通过跨模态的联合学习,模型可以发现和利用不同模态之间的互补性和关联性,从而在训练过程中不断优化自身的表征能力和泛化性能,实现自我进化。在机器人生态圈中,多模态大模型通过不断学习和优化,能够提升任务的筹划效率和策略,在新的环境中适应任务场景需求,实现自主决策与执行闭环。同时,模型通过持续接收生态圈内多机器人交互产生的经验数据,进一步优化任务分配逻辑与资源调度机制,强化对复杂约束条件的处理能力,推动机器人生态圈从被动响应向主动协同进化,为实现高度自主化的机器人系统运行提供核心技术支撑。

三、

月面机器人生态圈的应用场景

在月球探索中,机器人生态圈的超级自动化功能发挥着至关重要的作用,旨在减少对外部干预的依赖,能够在复杂且恶劣的太空环境中长时间独立执行任务。与人类执行任务相比,机器人不需要生命维持系统,可以在真空、极端温差、辐射等极端条件下工作,降低了经济成本和人员安全风险。  

月球的环境监测场景中,涉及到多个高度专业化的子系统协同工作,以实现对月球环境的全面监控和数据收集。环境感知装置负责实时动态感知月球表面的温度、湿度、气压、光强、风力、噪声、辐射及空气成分等关键参数,能够将收集到的环境数据及时、准确地传达给生态圈内的其他子系统。能源供给设施是生态圈中的重要组成部分,能够有效利用月球环境中的太阳能、风能等能源,具备能源的开采、收集、储存、调配与输送功能,确保了生态圈内机器人的能源自给自足,为环境监测任务提供持续的能源支持。通信装置建立起生态圈内各子系统间的实时通信,确保了信息的快速传递和任务的协调执行。导航定位装置为生态圈内的机器人提供精确的位置和速度信息,确保它们在复杂的月球地形中安全、准确地执行监测任务。  

月球的资源开采场景中,机器人生态圈能够利用机器人对月球表面的月壤、月岩等物质资源进行详细的勘探和评估,通过搭载高分辨率的遥感设备和地质勘探仪器,识别月球表面下的矿产资源分布,包括水冰、钛铁矿、氦-3等战略性物质资源。能源补给机器人在月球表面进行资源采集作业,对月壤和月岩进行初步的开采和筛选,将采集到的原始资源转化为可供月球基地使用的物质和能量,同时,充分利用月球表面的太阳能,进行能量的储存和分配,为整个生态圈提供持续的能量支持。  在基础设施建设任务中,由制造机器人利用3D打印等制造技术,根据预设的设计和规格要求,生产出所需的零件和结构组件,通过自动化的制造流程,实现零件的批量、快速生产。其中,原料与零件库储存了制造过程中所需的原料和制造完成的零件,确保生态圈的持续运作和基础设施的维护。搬运机器人负责将生产出的零件从运输到装配地点,考虑月球的低重力环境,并稳定行驶、准确送达。装配机器根据施工计划进行组装工作,配备机械臂和定位系统,以实现高精度的装配操作。 

在月球机器人生态圈的整体运行中,自维持机器人能够自我诊断并修复故障,减少对地面控制中心的依赖,这对于远离地球的深空任务尤为重要。在构建和维护空间站、卫星网络或未来可能的太空基地时,自维持机器人可以执行建设和维修任务,如空间站外部检查、维修破损部件等。任务执行类机器人可以进行星球表面探测,装备各种传感器和相机,能够对星球表面进行详细的地形地貌探测,利用机械臂采集岩石和土壤样本,为科学家提供关于月球的物质样本。在缺乏导航信号的外太空环境中,机器人依靠星敏感器、惯性测量单元、激光雷达等自主导航系统来确定位置,规划路径并避免障碍物,确保在复杂地形中的安全行驶。通过不断学习和适应,自进化机器人在面对复杂任务时能够模拟、试验和反馈循环,发现并实施更优的解决方案,学习和适应月面环境,生成更高级的智能和生存策略,为无人化的月球资源开发奠定基础。

四、

结论

本文为月面机器人生态圈的构建提供了理论支持,同时为月球探索任务的实施提供了创新的解决方案。笔者深入探讨了月面机器人生态圈的科学概念及其超级自动化实现方法,通过构建月面机器人生态圈的超级自动化技术体系,实现人形机器人在物理域上的智能自动化、软件机器人在信息域上的智能自动化、多模态大模型在认知域上的智能自动化,为月球探索和资源开发提供了新的可能性。月面机器人生态圈的构建是实现月球长期探索和资源开发的关键,通过超级自动化技术体系,能够提高机器人的自主性和适应性,使其能够在月球恶劣的环境中稳定运行,并高效地执行多样化的任务。

站务

全部专栏