靠着两个不公平优势,AI 玩《星际争霸》碾压了人类
编者按:继在最复杂的棋类游戏击败了人类世界冠军之后,Google的DeepMind又瞄准了最复杂的视频游戏——实时策略游戏《星际争霸》。经过短短两周的训练之后,前不久,其AI AlphaStar以两个5:0分别击败了两位顶级的人类职业玩家,令世人再度感到震惊。不过,AI的能力真的有这么强吗?arstechnica网站的一篇文章对此进行了剖析。
在第四场比赛的一场决定性的战斗中,2队AI控制的追捕者逼近Grzegorz "MaNa" Komincz的基地
2014年Google收购的AI初创企业DeepMind,其最知名的成就也许是成为第一个击败人类围棋世界冠军的AI。在掌握了全世界最具挑战性之一的棋类游戏之后,你接下来又会干什么呢?攻克最复杂的视频游戏。DeepMind于是决定写一个AI来玩实时策略游戏星际争霸2。 AlphaStar也许是最强的星际争霸AI。但它的成就未必像乍看起来那么大,因为这不是一项完全公平的比赛。 这些专业的说法很绕,不过DeepMind解释了训练其虚拟星际争霸玩家改进技巧的部分细节。 按照DeepMind的说法,一些AI积累的游戏用时相当于人类玩200年的时间。在2周之内,这个进化过程极大地改进率AI的平均技能水平: 到最后时,DeepMind挑选了其中5个最强的AI来应战人类玩家。这种方案的后果之一是人类玩家在每一场比赛时都要面对AlphaStar不同的对战策略。 DeepMind当时还邀请了游戏主播在复盘时对赛况进行评论。主播被AlphaStar的“微”能力——也就是在激战正酣时迅速做出战术决策的能力给震惊到了。 追猎者并没有特别强大的武器和装备,所以跟不朽者和执政官拼刺刀的时候一般都是要输的。但是追猎者行动快,而且有一门叫做“闪现”的绝技,可以瞬间传送到范围内的目标可见地点。 观察AlphaStar与Komincz第四场大战的评论员对AlphaStar的微能力感到惊叹。 AlphaStar的表现尤其令人印象深刻,因为它一度对不同地方的多组追猎者采用这种战术。 Stemkoski补充说:“真正令人震惊的是当我们看看每分钟动作数时,其实AlphaStar是没那么高的。这是一个可以接受的专业级速度。” 不过另一位reddit用户迅速指出,5秒钟在星际争霸游戏里面已经算很长了。这些限制似乎意味着AlphaStar可以在1秒钟之内执行50个动作,或者以每秒15个动作的频率执行3秒钟的动作。 更重要的是,AlphaStar有能力以外科手术般的精度使用API,而人类却受制于计算机鼠标的机械限制。如果你看了像Komincz这样的职业玩家玩的话,你会看到裸动作的数量要远远超过有意义的动作的数量。 所以限制AI可以执行的动作的裸数量为典型人类的水平未必意味着有意义的动作数量具有可比性。 DeepMind有几周的时间去训练这一新版本,但跟前个月与Komincz比赛的那个版本相比似乎要弱很多。 在表演赛的最初几分钟里,Komincz稳稳地挡住了攻势,轻易就抵挡AlphaStar的攻击。然后他发动了狡猾的反击。 Komincz把两支强大的不朽者部队装进了一个叫做折跃棱镜的运输船,然后将它们运到AlphaStar的基地,在那里脆弱的探测器正在采矿,这些矿石是AlphaStar的战争武器的动力来源。他把不朽者投放到基地里,开始炸毁探测器。 Komincz然后又故伎重施:投放不朽者,摧毁几个探测器,然后在追捕者赶过来之前再把不朽者送走。就这么反复这样的操作。当他这么做的时候,AlphaStar的追捕者因为徒劳地往返而浪费了宝贵的时间。 当Komincz第三次投放不朽者到AlphaStar的基地时,Stemkoski说:“这就是我经常看到的人机对战的情形。当你找到对方的一个漏洞时,你就会反复地抓住那个错误攻击,屡试不爽。” 我们不知道Komincz在输掉之前的5场比赛之后究竟是如何赢得这场比赛的。似乎摄像头视图的限制无法直接解释AlphaStar不能对折跃棱镜的投放攻击做出有效响应。 最后看来,上次的演示引出的问题要比回答的要多.DeepMind称自己在短短一周的训练之后就看到AlphaStar的表现有了重大改良。如果这一进程延续下去的话,AlphaStar也许就能恢复对人类玩家的决定性优势,哪怕对其API施加新的限制。 另一方面,尚不清楚引入的这个摄像头限制是否足以保证比赛的公平性.AlphaStar仍然可以通过特殊API获取游戏信息,这个跟人类玩家获得的信息是不一样的。这个API也许能让软件收集更多的信息,从而比人类玩家更迅速,更精确地发布指令。 让比赛公平的终极方式是让AlphaStar使用跟人类玩家一样的用户界面。当然,这个界面可以是虚拟化的,但游戏应该是跟人类玩家一样的裸像素输入,而且应该要求利用一系列的鼠标移动和点击来输入指令 - 而且输入速度要限制到人类手的操作能达到的程度这是唯一可以确保AlphaStar没有给予其软件不公平优势的办法。 原文链接:https://arstechnica.com/gaming/2019/01/an-ai-crushed-two-human-pros-at-starcraft-but-it-wasnt-a-fair-fight/