AI“完胜”美军功勋飞行员 无人战机时代要来了?

2020年8月18-20日,美国国防预研局(DARPA)联合美国空军研究实验室(AFRL)以及约翰·霍普金斯大学应用物理实验室共同举办了“阿尔法空战格斗系列”比赛(AlphaDogfight Trials)的第三轮和最后一轮比赛。在这最后一轮的比赛中,苍鹭系统公司(Heron Systems)的智能空战代理“隼”(Falco)以5:0的成绩在模拟器上战胜了一名拥有30年飞行经验的F-16战斗机飞行员。而美国国防部长马克·埃斯珀在近日宣布,美国国防部计划在2024年对AI控制的战术飞机进行实战试验,以对抗人类飞行员。对于此前AI战胜人类飞行员,埃斯珀认为这是AI技术影响美国国防部未来架构的一个例子。

有的人据此惊呼“战斗机AI时代已经来临!无人战斗机将彻底取代有人战斗机!”当然,这个名为“隼”的AI系统虽然大比分战胜了人类飞行员,但实际上人类飞行员也不必过于惊慌,因为这次模拟空战的环境设定过于简单,相当于对人类不利,而且AI本身也不够完美,如果比赛再继续进行下去,人类飞行员还是有机会把比分扳平甚至反超。人工智能的技术进步固然可喜,但距离取代飞行员、进而让有人驾驶战斗机退出历史舞台,还言之尚早。


AI战胜人类飞行员的背后,是美国DARPA在“搭台唱戏”

“阿尔法空战格斗”比赛隶属于DARPA战略技术办公室(STO)提出的“空战进化”(ACE)项目,最终目的在于通过举办比赛的方式吸引来自社会各界的人才参与未来的项目研发。该系列比赛在“马赛克战”的背景下举办,在技术上旨在模拟环境中提升AI进行视距内空战的水平,并提升人类飞行员对AI技术水平的信任程度。

经过前期的筛选,第三轮共有8支团队进入比赛名单,其中有洛克希德·马丁公司这样的防务巨头企业、佐治亚理工研究所这样的知名高等院校,也有极光飞行科学公司(该公司已被波音收购,但公司的品牌和团队予以保留)这样的知名创新技术企业。在这些知名的公司中,苍鹭公司并不显得突出。

苍鹭公司在1993年成立,规模也实属是一个小公司。该公司自2012年开始积极地探索AI在传感器开发、机器人控制和战略推理等方面的应用。除了开发ACE项目中的模拟空战的程序之外,苍鹭公司还深度参与了DARPA的“进攻性蜂群战术”项目(OFFSET)和“游戏平衡破坏者”项目以及AFRL的Skyborg项目等近十项美军AI项目,展现出了较强的创新能力。而该公司开发的深度学习框架算法在雅达利、毁灭战士和星际争霸2等游戏,以及仿真环境下的视距内外的空战等多个领域内都展现出了超越人类的水平。

所以苍鹭公司能在这一系列比赛中打败其他参赛队伍,尤其击败洛克希德·马丁公司的AI程序并不稀奇。这也说明在这些新兴交叉领域,传统大型公司并不一定都比小公司实力更强,正如波音也要收购极光飞行科学公司来提升自己的创新能力一样。



在实战中人类飞行员仍然占据上风



虽然这个名为“隼”的AI在模拟器环境下AI战胜人类飞行员,但这并不是很“神奇”的事,甚至也不必解读为AI战胜人类的又一次重大事件。实际上,其他7支队伍开发的AI算法在与人类飞行员在同样环境下对抗时可能都会取胜,其原因是他们使用的均是已有的算法和工具,只是根据具体的场景和任务做了相应的改造而并无本质的差距。因此,其他7个空战AI只是没有打过苍鹭的“隼”而已,并不代表也打不过那位飞行员。

当然这位飞行员也不必妄自菲薄,因为他只是在模拟器的环境下没有打过AI,如果到了真实环境下人类飞行员的取胜把握还是十拿九稳的。

之所以这么说,是因为本次“阿尔法空战格斗”比赛在复杂度、信息可观测性和反应速度等方面所展现出的难度和特殊性都并不算突出,相比于过去AI挑战围棋、星际争霸、Dota2等游戏的技术需求还要低不少。







这次的比赛使用的都是简化的开源仿真环境和飞行动力学模型,场景也是相对简单的一对一狗斗,相比真实的空战场景是最为简单的数字抽象。而在真实的作战中,作战环境涉及人-机-自然环境三个复杂实体,以及它们之间复杂的作用关系,如果这些作用关系要用数据量来表示的话,比模拟器上的空战复杂好几个数量级。对于AI传感器的感知能力来说,现实世界需要考虑的因素太多,而传感器仍然是不如人类双眼的地方。

这从汽车的自动驾驶技术就可以看出来,实际上目前自动驾驶技术仍然不够“智能”的主要原因,就是传感器不够“智能”,远不如人眼人耳更灵活。真实世界的情况是无限多的,例如空中飘过的塑料袋、地面反光的积水等,都对传感器造成了影响,对其识别造成干扰,而传感器没有识别出障碍物也是目前多次自动驾驶车辆事故的主要原因。因此,传感器的感知问题是现在自动驾驶仍然难以媲美人类驾驶员的主要问题所在。

到空战方面,相比汽车的自动驾驶,虽然飞机在天空中的环境比地面环境要相对“干净”许多,不会突然撞到无法识别的物体;但这仅是指在飞行环境下,而在军事作战环境的非配合、强干扰、强对抗环境下,对传感器的要求只会更高。

除环境和传感器的问题以外,AI程序本身也有一定缺陷,经常在基本的战斗机机动中犯错误,例如不止一次地将飞机转向到其认为人类飞行员会去的方向,但多次结果都被证明错判了人类飞行员的想法。这说明深度学习技术虽然使AI汲取了很多“正确的经验”,但如何让这些经验与实际情况更好地结合起来还需要进一步努力。因此,DARPA战略技术办公室认为AI程序必须在实际战斗场景中增加更多的警告或限制,以防止大量AI控制的无人机发生空中相撞等事故。

另外,这次空战毕竟是在模拟器上进行的,人类飞行员的对手也是没有生命的AI,因此对于某些人类特有的要素并不重视,例如“安全”或“生命”,这也是AI可以相对无限制的操控飞机,但人类受到长期训练习惯的影响,不可避免地受到某些操作上的限制。例如在传统的飞行训练中,为保证训练安全要避免飞机相撞,这就要求飞行员彼此之间的距离不得小于500英尺(约150米)。以飞机的相对速度而言,两架飞机间这个距离留给人类的反应时间只有半秒不到,因此飞行员受到的训练是不要使飞机过于接近,有30年经验的飞行员对此更习惯更是根深蒂固。






参加此次空战的飞行员邦格(Banger)也认为,虽然这种限制在实际的空中作战中也不适用,但长期遵守训练规则会使飞行员养成习惯,“可能不愿意将飞机拉到可能发生碰撞的位置,或处于迎角过大的可能失速的姿态,但AI并没有这种问题,反而会利用人类这些习惯。”


结语



因此,总体来看,现有的技术条件下的AI并不能像宣传那样经常打败人类,“打败人类”只是在特定场景特定范围特定情景下做到的,在真实的对抗场景下,技术水平还远没有达到。当然,AI自主空战技术是个战略意义极高的方向,DARPA启动ACE项目并举办AlphaDogfight比赛也是为了吸引更多工业界、学界和商业界人才团队加入其研发工作,从而在战略层面上带动本领域快速发展。

推荐阅读