美国空军ALPHA空战系统介绍

                  500ALPHA空战系统是一种人工智能(AI,ArtificialIntelligence)系统,可在高保真模拟环境(即模拟,集成和建模的高级框架,AFSIM,The Advanced Framework for Simulation,Integration and Modeling)中控制无人作战飞机(UCAVs,Unmanned Combat Aerial Vehicles)执行空战任务。ALPHA空战系统是由受雇于美国空军研究实验室(AFRL,US Air Force Research Laboratory)的Psibernetix公司于2015年5月开始开发,同年11月份该系统在一些领域就已经取得巨大成功。

Psibernetix公司的CEO是NickErnest,他博士毕业于辛辛那提大学宇航工程专业,ALPHA是他在博士期间的工作之一。他的导师是KellyCohen和CoreySchumacher。NickErnest博士期间的研究课题是遗传模糊树(GFT,Genetic Fuzzy Tree),遗传模糊树在处理非常大、非常复杂的问题时表现出难以置信的能力。开始时他们工作的目标是在低保真模拟环境中控制地面打击UCAV的飞行,即ALPHA的初级版本LETHA。由于他们在这个项目上的巨大成功,Psibernetix公司得到美国空军研究实验室(AFRL)的青睐,进一步将GFT方法应用于更复杂的问题。

500

图1:ALPHA系统的图标

正如无人机在20世纪90年代中期代表美国空军的革命性力量一样,在不久的将来在空战环境中的自主无人机集群无疑将代表着空中力量的革命性飞跃。今天的战斗机在高于12000米的高度飞行时以超过670米/秒的速度相互靠近,空对空战术的选择和应用需要评估战术的优势或劣势,并在几微秒内作出适当反应,错误的代价十分高昂。

ALPHA能够在AFRL之前用于控制红方的基线控制器上取得巨大成功。然而,ALPHA击败AI飞行对手的能力只是衡量成功的一个标准,它还必须能够击败训练有素、经验丰富的人类战斗机飞行员。ALPHA由空战专家已退役的GeneLee上校评估,作为前美国空军专家,GeneLee是美国空军战斗机武器学校的毕业生和对手战术(侵略者)教练,并作为地面控制拦截军官或作为机载空中警报控制系统(AWACS,Airborne Warning And Control System)的任务指挥官指挥或驾驶飞机完成成千上万的空对空拦截。

当GeneLee上校手动控制蓝方飞机对抗由AFRL先前使用的基线控制器控制的红方飞机时,他可以很容易地击败它们。然而,即使在反复尝试对抗ALPHA之后,他不仅没有完成一次成功的杀戮,而且每次经过长时间的交战后,他都会被ALPHA射杀。他将ALPHA描述为“迄今为止最具侵略性,反应迅速,最具活力和可信度的AI。”

500

图2:已退役的空战专家GeneLee上校在空战模拟器中与ALPHA对战

500

图3:从左至右,Psibernetix CEO Nick Ernest,Psibernetix公司项目主管David Carroll,美国空军退役上校GeneLee在空战模拟器中

ALPHA系统的研究动机

近年来,随着计算、传感器、通信和其他领域的进步,智能系统的功能进步迅速。此外,许多人工智能系统已经被开发出来,并且在某些问题和游戏中可以胜过人类。在具有不确定性和未知数的复杂时空环境中对有限分布式资源的最佳利用仍然是对这些技术的重大挑战,能够执行这些任务的智能系统将具有十分广泛的应用。

现在的无人机可以被远程操作,并且能在复杂的时空环境中完成一些特定的任务。这些无人机的优点不仅仅是保证人的安全性,在其他方面他们也具备有人机不可比拟的优势,例如小型无人机可以以超低的成本和超快的速度完成一些特定任务,监视无人机可以超长时间完成监视任务。现代无人作战飞机可以完成一些简单的空对地攻击,未来的无人战机将会能力更强,自主性更高。

无人系统将飞行员从飞机上解放出来,类似的,自主系统大大减少了对训练有素的远程操控飞行员的需求,但是研发自主系统的原因不限于此。远程操作受到通信的限制,对于慢速飞行的用于空对地导弹打击任务的无人战机,可以通过降低传感器的分辨率和聚焦地面目标来减轻通信限制。但是这些解决方案也带来了负面效果:专注于目标以满足视频输入的带宽限制可能会导致无意的附带损害,这具体取决于周围的环境,例如这些飞机极易受到敌方防空系统的攻击;更高的飞行速度,未来极其精确的传感器和武器系统,以及应对敌人威胁的动态计划将需要大量的带宽和几乎零延时,如果需要卫星通信远程控制飞行器的话,那么由于光速的限制,无法满足现实的需求。

如果机载智能控制器可以操作无人战机集群,那么指挥中心与无人机集群的通信只需要交流高层级的命令即可,这种高层级的命令需要的带宽很小,这种技术也可以很方便地应用在其他场景。智能自主控制器的生成是一个十分复杂的问题,例如对不确定性的适应性,对许多动态状态的适应性,以及深度学习推断并将其应用于不同的或者新场景的能力都是新的要求。另外,控制器的训练和最终控制器的计算成本也是重要的考虑因素。遗传模糊系统(GFSs,Genetic fuzzy systems)在模糊推理系统(FISs,Fuzzy Inference Systems)的训练中表现出了很强的能力,但是单个FIS需要巨量的输入和输出量来解决这个问题,导致其极大的尺寸和复杂性。级联FIS是由FIS构成的自上而下的树状结构,旨在简化单个复杂的FIS中所需的规则数量。模糊树是解决这个问题的一个不错的方法,构成模糊树的每个FIS只解决控制问题的一小部分,并且在模糊树中允许为将要考虑的许多不同状态创建专门的规则集。

ALPHA中使用了称为遗传模糊树(GFTs,Genetic Fuzzy Trees)的方法训练一组FIS,这些FIS都具有不同程度的连通性和多种可能的清晰输出。该方法可以创建一系列有效的规则,这些规则经过训练并且相应的隶属函数(MFs,Membership Functions)被调整,在极其复杂的问题中产生确定性的控制指令。

Psibernetix公司的母AI——EVE在大多数AI/机器学习方法中,某种类型的搜索算法用于“教导”系统。通常采用的是遗传算法,这是“遗传模糊树”中的“遗传”所暗示的。该算法基本上是“适者生存”的软件实现。对潜在系统的“种群”进行生成、评估、培育以创建新的种群,直到找到满足所需要求的解。

PsibernetixInc.的EVE系统取代了传统的遗传算法,与被动搜索算法不同,EVE本身就是一个遗传模糊树。EVE是一种可以创建和优化其他遗传模糊树的遗传模糊树,这意味着她可以自学如何最好地教授其他AI。在迄今为止的每个应用中,EVE在获得的结果和获得所述结果所需的时间方面都表现了很好的性能。

智能搜索只是EVE的众多功能之一。例如,她还可以智能地利用计算机网络,EVE自动搜索它有权访问的核心,甚至跟踪其性能,因此她知道如何最佳地使用它可用的每种资源。EVE是PsibernetixInc.削减成本和开发时间的主要工具之一。

ALPHA系统

ALPHA目前的主要目标是成为飞行员在AFSIM仿真环境中进行训练的智能敌对力量。模拟、集成和建模的高级框架(AFSIM,The Advanced Framework for Simulation,Integration and Modeling)是一个用C++编写的交战和任务级别的仿真环境,最初由波音公司开发,现在由空军研究实验室(AFRL)管理。AFSIM的开发旨在解决现有传统仿真环境中的分析能力缺陷,并提供一个内置更多现代编程范例的环境。AFSIM可以模拟从地下到太空以及多个级别的模型保真度的任务。AFSIM环境由三部分软件组成:框架本身,它提供了定义平台和交互的主干;一个用于场景创建和脚本的集成开发环境(IDE)以及一个名为VESPA的可视化工具。AFSIM还提供灵活且易于使用的代理建模体系结构,该体系结构利用行为树和分层任务,称为反应式集成规划架构(RIPR,Reactive Integrated Planning aRchitecture)。AFSIM目前受国际武器贸易条例(ITAR,International Traffic in Arms Regulations)限制,AFRL仅在DoD(United States Department of Defense)社区内分发AFSIM。虽然ALPHA中并未特别模仿任何系统,但AFSIM实际上代表了一种现代空战环境,其中包含适用于飞机、传感器和武器的模型。数据从传感器收集、实时融合并发送到ALPHA,可能包含噪声和潜在的故障。接收到该数据馈送并将命令发送到每个平台的唯一用户数据报协议(UDP,User Datagram Protocol)端口,导致该问题包含实际硬件实现中存在的一些软件复杂性。

对于目前的任务,ALPHA作为红方部队,与蓝方相比,红方受到较短距离导弹和导弹有效载荷的限制。并且ALPHA没有空中预警和控制系统(AWACS)支持,但是蓝方却有AWACS支持,AWACS可以提供该区域的360°远程雷达覆盖,目前任务中假设双方飞机的机械性能相同。ALPHA对自己的系统有详细的了解,但是对于蓝方部队开始时只有有限的认知,并且必须依靠其传感器来获得蓝色部队的态势感知(SA),开始时红方不知道蓝方的数量,为了抵消这些弱点,ALPHA通常比蓝方力量更具有数量上的优势。目前的问题主要集中在视距外的空对空作战任务上,目前不考虑地面目标或需要护送的任务。

目前的任务是两架蓝色战斗机和四架红色战斗机,红色飞机从一个防御的海岸线开始,蓝色飞机在西边54海里,蓝方每架飞机都有4个远程导弹(LRM,Long Range Missile)和4个战术短程导弹(SRM,Short Range Missile),而红方在每架飞机上有4个中程导弹(MRM,Medium Range Missile),红方雷达是远距离的,具有+/-70°方位角和15度仰角。任务的初始状态如图4所示,蓝色AWACS在屏幕外蓝色战斗机的西北方向。

500

图4:Graphical display of the AFSIM simulation environment,Sprites foraircraft not to scale.

开始时ALPHA的目标是在AFSIM中在性能上超过AFRL使用的基线控制器,但是一个月后,ALPHA就完成了这个目标,现在ALPHA的目标是与训练有素的人类飞行员对抗,如图5所示。

500

图5:Side-view during active combat.Past and current missile detonationlocations marked.Two Blue vs.four Red,all Reds havesuccessfully evade dmissiles,one Blue has been destroyed,Blue AWACS in distance.

ALPHA从系统中获取了大量数据,在这个示例任务中已经考虑了150多个输入,对于某些数据,ALPHA既使用当前值,也使用历史数值。这些输入包括所有位置、速度和加速度状态、估计的导弹射程数据、每个平台的可见度、柏忌比率以及地方的射击次数,ALPHA目前可控制每架飞机的运动和射击能力。

方法与实施

遗传模糊树方法是一个级联的模糊推断系统的集合,其中遗传算法或者其他学习系统同时训练模糊树中的每个系统。该方法的优点是灵活和易于设计,其他算法可以很容易包含在这个系统中,图6显示了此类系统布局的一个示例。能够输入从专家知识中学到的经验教训,以及通过学习系统充分优化这些知识的能力是GFT成功的重要因素。这种架构,模糊逻辑的使用以及Psibernetix对Python编程语言的使用使得这些系统的开发十分迅速。

500

图6:Example Fuzzy Tree layout.

ALPHA目前拥有高级战术、射击、逃避、情景感知和防御等多个分支。Psibernetix正在申请专利的EVE学习系统训练了ALPHA,而不是将标准遗传算法用作ALPHA的学习系统。EVE已被证明在极其复杂的问题中具有无与伦比的学习能力,在这些问题中,获得绝对最优解是不必要或不实际的。EVE是一个GFT,其目标是创建和优化其他GFT。通过多次递归应用,EVE已经可以非常有效地训练其他GFT。

在AFSIM内训练AI的计算成本和复杂性是其他方法的限制因素。GFT非常轻巧,与Psibernetix的高效模糊逻辑模块PsiberLogic相结合,以及在计算成本高昂的程序中使用Cython计算机语言,使Psibernetix能够通过台式PC完成这项任务。ALPHA的EVE培训最初与AFRL先前使用的基线控制器进行了对抗,但现在针对ALPHA的不同的静态版本进行了。EVE在这里优化了FIS以及其他参数,如阈值和生成。EVE生成中的每个ALPHA都调用一个单独的AFSIM实例,并为每个平台分配唯一的端口号。停止运行被插入程序中以防止非常长的任务引起系统死机。每个ALPHA和AFSIM组合仅占用一个核心,从而减轻了实施此过程的难度。AFSIM可以以事件步进的方式运行,以处理器允许的速度执行任务。图7描述了培训过程。

500

图7:EVE parallel training setup.

测量ALPHA每个实例性能的适应度函数或方程旨在完全捕捉良好行为的含义。仅仅奖励友方的射杀和惩罚友方的失误和死亡,就可以产生一个称职的控制器。但是这是可以改进的,因为它可以在蓝方无法完成一次击杀,红方没有接近蓝方交战区域(WEZ,Weapon Engagement Zone)的情况下完成任务。产生这些表现的两种版本的ALPHA应该有显著不同的价值。为此,每架红色飞机的防御性不断被控制器的性能指标所取代,这使得EVE能够以时间和安全的最佳方式寻找完成任务的ALPHA,具有最佳的红方导弹精度和最小化的敌方导弹射击。未来的工作可能包含不同的传感器和任务,这些传感器和任务将允许EVE训练ALPHA击败整个蓝方力量而不会被发现。

这项训练使ALPHA做出了表现良好的决策,计划开展更多训练任务以形成训练组合,并且结合ALPHA的其他静态蓝方变体,例如一部分飞机侧重于攻击另一部分飞机强调防御的战术。预期的对手是人类这一事实是一种复杂性来源,在典型的机器学习环境中难以解释。人类飞行员可以执行非常奇怪的、错误的或者显然次优的命令,只是为了迷惑或利用ALPHA。非常冗长,低效甚至自杀的动作可能与ALPHA通过EVE训练所面对的对手显著不同。为了解决这个问题并启用训练后的测试和调整,他们创建了一个简单的用户界面,允许人们利用这个界面对抗ALPHA。人类飞行员已经能够对两架蓝方飞机实现适度但合理的控制,以与ALPHA竞争。

结果和结论

目前经过EVE训练的ALPHA已经是一个致命的对手,ALPHA利用有数量优势但功能较弱的飞机训练。为了完成任务,蓝方飞机必须被操纵到不利位置,因为他们的杀伤范围比ALPHA的红方更远。

例子一:

一旦有机会,ALPHA就可以执行致命的合作策略将蓝方扼杀,这种策略的流程如图8所示,一共分为3个不同的阶段。

第一阶段:

WOLF-1在地图最北端,WOLF-4在最南端。ALPHA试图通过使WOLF-1和WOLF-4爬升高度获得侧翼,并以相反的和广的角度接近蓝方。WOLF-2和WOLF-3降低速度,爬升高度,以保持与蓝方的距离。

500

图8:Tactic displaying ALPHA sutilization of flanking the opponent

第二阶段:

开始时,因为WOLF-1发射一个MRM以引发蓝方的防御反应,这种导弹射击的范围是蓝方飞机需要逃避WOLF-1的导弹或被导弹击中。如果先发制人,蓝方可以采取另一种逃避路线,如果WOLF-1延迟这次射击,它将进入蓝方占优势的武器作战区域。如果成功完成这个步骤,WOLF-4会得到一个占优的机会。在第二阶段不久,WOLF-4的发射计算机报告说敌人可以轻易地躲避导弹,但这并没有考虑到最佳逃避路线被切断的事实。WOLF-4完成了两次射击,然后战术的最后阶段开始,WOLF-1和WOLF-4保持侧翼,但保持宽的接近角度,以便能够避开任何潜在的蓝方射击,如果他们没有被射击,但是WOLF-4的导弹没有击中敌机,他们将会再次射击。到目前为止,WOLF-2和WOLF-3已经爬升到高海拔并且速度增加。如果侧翼的战术失败了或被射击,那么中间组就可以前进并与蓝方交战。

例子二:

在另一个例子中,蓝方首先射击,防止红方获得早期的位置优势。这项任务较长,将分为6个不同的阶段。

第1阶段和第2阶段如图9所示。由于蓝方的射程较长,ALPHA必须躲避这些导弹,让蓝方前进。在第1阶段,南部蓝方BLUE-2朝WOLF-4发射LRM。在第2阶段,北部蓝方BLUE-1朝WOLF-2和WOLF-1方向发射一枚LRM,而BLUE-2朝WOLF-4再次发射。

500

图9:Phases 1 and 2 of example mission.

这些导弹对ALPHA来说有足够的危险,在确定每个敌方导弹的目标之后,红方必须执行最佳规避动作才能在这波攻击中存活。之后,蓝方飞机分开,BLUE-1向北移动,BLUE-2则朝着WOLF-3飞去,WOLF-3保持与蓝方飞机的距离,即使它没有被BLUE-2射击,后面将证明这是任务成功的重要组成部分。蓝方的第一阶段的这种激进攻击不允许ALPHA利用图5中的钳形策略快速结束任务。

即使在躲避的情况下,ALPHA也有能力继续寻求位置优势。例如,如果从大致相同的方向逃避导弹,如果可能的话,两个红方飞机将选择在不同的方向上进行机动。此外,如果逃避导弹,ALPHA也不会停止跟踪所有其他敌人的防御性,也不会阻止ALPHA考虑对所有威胁进行射击,ALPHA也尽力防止敌方在这些时期获得位置优势,需要采取防御措施才能防止敌方飞机获得这样的优势。

所有最初的蓝方导弹在第3和第4阶段之前都被击败,如图10所示。然后ALPHA利用蓝方的不当举动,在第3阶段,BLUE-2已经设法朝WOLF-3中近距离射击,但不得不过度扩展以实现这一目标。这允许WOLF-4转向并朝BLUE-2发射MRM。BLUE-2开始躲避,BLUE-1在第3阶段过来协助他的僚机BLUE-2朝WOLF-1射击,否则红方将获得对抗BLUE-2的致命钳子。由于BLUE-1必须转回南方,WOLF-2向后转,成功完成逃生路线。WOLF-3成功击败了BLUE-2的导弹,向北转向,追逐蓝方,而WOLF-1正在躲避BLUE-1的导弹。WOLF-4可以前进并追逐蓝方,并进入第5阶段,朝BLUE-1发射MRM,迫使它再次转向并向北逃避。

500

图10:Phases 3 and 4 of example mission.

虽然开始时蓝方实施了极具侵略性的行为,但是到第4阶段结束时ALPHA已经处于非常有利的位置,蓝方已经使用了大量弹药。即使ALPHA在第5阶段处于不太有利的位置,蓝军也无法保持目前的侵略速度。当任何红方飞机的防御水平高于阈值时,他们会尝试以防御方式利用其MRM。虽然ALPHA多次被射击,但如图11所示,它没有采取任何防守射击。实际上,在整个任务期间,ALPHA并没有感觉受到威胁。虽然图8中的第一个任务显示ALPHA采取先发制人并迅速结束任务,但此任务迄今为止突出了ALPHA面对高度攻击性敌人的能力。使红方成功进入第五阶段的关键是红方一直迫使蓝方在两个负面结果之间做出选择。如果BLUE-2没有追击WOLF-3,它将不得不花费更多资源来保持与WOLF-3和WOLF-4的远离,无论如何,它无法保持更长的时间。BLUE-1可能已经放弃了他的队友,允许BLUE-2在第4阶段结束时被射杀,但是如果这样做了,进入第5阶段红方将包围BLUE-1。

500

图11:Side-view of example mission showing traces to phase 4.

图12显示了此任务的最后阶段。到第5阶段,BLUE-2已被WOLF-4的第二次射击摧毁,WOLF-2在北部,保持安全距离,但继续阻挡蓝方逃生的简单路线。射向BLUE-1的WOLF-4的导弹能够被击落。第6阶段中WOLF-3是最接近蓝方的飞机,一旦在其致命范围内,射击杀死剩余的蓝方战斗机,最后以红方胜利结束任务。

500

图12:Phases 5 and 6 of example mission.

阿尔法击败AI飞行的敌人的能力只是衡量成功的一个标准,它还必须能够击败训练有素、经验丰富的战斗机飞行员。ALPHA由Colonel(退休)Gene“Geno”Lee评估,Geno注意到第一代红方ALPHA如何对抗ALPHA的蓝方变体,但由此产生的交战往往以双方的重大损失告终。Psibernetix和Geno共同努力开发策略、技术和程序,以克服红方ALPHA的有效载荷少和无AWACS的缺点,利用蓝方的错误,并利用数字平台的优势(当情况出现时)。目前经过修订的红方ALPHA模型为蓝方对手提供了可靠的进攻战术和及时的防守反应,挑战了蓝方的雷达排序逻辑,压缩了他们的交战时间线,并迅速将蓝方置于一个他们无法逃脱的防守位置。长期交战后的最终结果是蓝方完全失败,红方ALPHA没有或损失最小。

当Geno手动控制蓝方飞机对抗由AFRL先前使用的基线控制器控制的红方时,他可以很容易地击败它。然而,对抗更成熟的ALPHA版本时,即使经过多次尝试,他不仅没有得到一次杀戮,而且每次经过长时间的交战后,他都会被红方射杀。他将ALPHA描述为“迄今为止最具侵略性、反应迅速、最具活力和可信度的AI”。

如前所述,ALPHA的高性能并非其唯一的优势,其使用的方法非常适合验证和确认。验证和确认最好被描述为一个过程,通过该过程,可以讨论特定系统既满足其设计要求(验证),又实现其设计的整个系统(确认)的目标。更常见的是,验证是问“我是否正确构建它?”然而确认是问“我是否构建了正确的东西?”随着更高级别的自治成为现实,为验证和确认的目的进行测试和评估(V&V)成为部署更先进算法的主要障碍。

DoD Autonomy TEVV(Test,Evaluation,Verification and Validation)战略指出“自治系统中最困难和最具挑战性的部分是嵌入其中的智能、学习和自适应软件。”然后声明“自治系统具有特征适应性,智能化和/或可能包含学习。由于这个原因,算法决策空间要么是非确定性的,即由于每个输入的多个可能结果而无法预测输出,要么是复杂的难以处理。由于它的大小,这个空间不能被穷举,检查或测试,随着所有已知条件、因素和相互作用的扩大,它呈指数增长。因此,目前没有确定的指标来确定成功的各个方面或与列举的基线状态进行比较”。因此,智能软件的V&V面临的一个关键挑战是设计一种自适应学习算法,该算法可以同时实现其决策、行为和因子影响的透明度。

模糊逻辑通过设计提供了一种机制,通过利用将语言、自然语言需求综合到现实世界模型中的能力,在算法上推理世界,同时仍然保持与人类设计者与设计系统之间清晰易懂的联系。模糊逻辑的另一个特别优势是能够在训练期间和训练后为内部层提供实时透明度。与其他学习方法不同,在模糊逻辑的特定实例中基本上没有“隐藏层”。在任何时候,GFT都可以转换为一阶逻辑模型,将传统上的称为“真实程度”的东西翻译成“事实、对象和关系”的有限范围。具体来说,我们已经开发出了使用完全相同的算法运行ALPHAGFT中的FIS结构,该算法将转换提供给一阶逻辑模型。使用基于可满足模数理论的模型检验器,可以针对所有可能的初始条件的一组定义属性一次性验证FIS规则结构的这些一阶逻辑模型。此外,FIS模型还可以转换为混合系统,表示离散行为以及每组活动规则中模糊化过程的连续表示。迄今为止对混合系统的分析在证明连续系统属性如稳定性方面是有效的。然而,在ALPHAGFT中,像稳定性这样的属性并不像灵敏度或稳健性那么有趣。混合转换的模糊逻辑GFT可以提供对训练和执行期间任何给定输入或n因子输入影响输出的程度的深入了解。

这些初步功能展示了UCAV控制领域中基于模糊逻辑AI的最复杂实现。利用GFT方法,易于验证和确认极高的任务性能不会带来高计算成本。ALPHA目前可以在CPU的单个3.2GHz核心上与AFSIM一起运行。以这种方式,ALPHA可以以154Hz的平均频率操作,每6.5毫秒,ALPHA可以接收整个传感器数据,组织数据并创建场景的完整映射,分析其当前的作战方案(CoA,course of action)并进行更改,或为四架飞机创建全新的CoA。ALPHA的代码中仍然存在许多增加速度优化的机会,运行时间的很大一部分用于运行UDP服务器和解释数据。如果在ALPHA中有单独的过程完成此任务,例如来自具有自计算能力的传感器的直接馈送,则ALPHA可以更快地运行,这可以通过仅对处理后数据处理过程进行计时来模拟,最终结果是ALPHA可以以平均超过1,100Hz的频率对相同的四架战斗机创建CoA。

因此,ALPHA目前可以在微秒的范围内运行,这是模糊控制的一个附带好处,这是利用低预算的消费级产品。人类思维是一台极其强大的机器,在某些领域总是具有无与伦比的性能。然而,ALPHA智能操作的速度在空对空战斗中具有明显的优势。

在混合载人和无人战斗机编队中结合这些优势可以证明是一种非常有效的战斗力量。ALPHA控制的飞机很乐意自愿采取危险的战术,让有人飞机担任更安全的支援角色。由于模糊逻辑的透明性和语言性,ALPHA将是一个非常容易合作的AI,并适合作为队友。ALPHA对于有人僚机的指令可以不断确定执行的最佳方式,并为其飞行任务的其余部分提供战术和情景建议。

ALPHA在其初始具体化完成之前被认为需要进一步的工作。重要的优势和能力仍有待建立,还需要完成进一步的培训。然而,这些早期的结果展示了它在对抗一个能力更强大,但是数量较少的对手时的优势和能力。这种行为主要与我们的防御措施的利用有关。当ALPHA应该执行某些特定战术时,计划进一步改进不同的攻击性分类器。未来将会发展具有不同飞机、武器、传感器和任务目标情形下的能力。

作者:张鹏 鞠鸿彬

※ ※ ※

创新体系工程基础理论和方法

推动系统工程理论再发展

全部专栏