围棋之后是游戏:谷歌AI把星际职业选手打懵了
继AlphaGo在围棋界战无不胜之后,人工智能又向游戏与电竞行业进军了。
但在之后的现场比赛中,MaNa成功为人类扳回一局,以1-0的成绩战胜AlphaStar。这同样也创造了历史——AlphaStar首次成为职业选手的手下败将。
赛后,DeepMind研究联席负责人David Silver表示:
尽管后续还有很多工作要做,但我希望未来的人们在回顾今日时,可以将这一比赛结果视为AI能力又向前迈了一步的表现。
对于AI而言,这类游戏比国际象棋、围棋等棋盘类游戏来得更难,不仅因为没有最佳策略,也是因为人工智能无法通过观察前一块棋子的移动来计算下一步棋,而必须实时作出反应。
时至今日,AI仍在挣扎应对《星际争霸2》的复杂性,鲜有系统能与职业选手的技术相媲美。
AlphaStar所遇到的第一个对手是《星际争霸2》Liquid战队的虫族选手TLO。在比赛前,DeepMind对AI进行了为期一周的训练,相当于让它玩了200年的《星际争霸2》。
尽管TLO曾自信表示有能力打败人工智能,但AlphaStar仍旧赢得了全部五场比赛,每一次还都使用了完全不同的独特策略。
但值得注意的是,在这场对抗中,AlphaStar确实更有优势——首先是因为比赛使用神族,而非TLO最擅长的虫族;二是因为尽管AI选手的视野也受到战争迷雾的限制,但它看到的地图已经被缩小了。
这也就意味着它无需像人类选手一样分配时间去关注地图的不同部分,而可以直接处理敌军和自家基地的信息。
不过,DeepMind研究人员指出,在同一时间内,AlphaStar仍然只会关注地图的单一部分,因此这也不能称之为优势。
话虽如此,人们还是能从比赛录像上看出,AlphaStar能够做到人类做不到的事——同时熟练控制三个不同区域中的作战单位。
在人类“绝世高手”与刚出道的新人AI首次交锋过后,DeepMind又将AlphaStar扔回了训练室,再次花了两周时间让它吸取经验。
此后,AlphaStar在与TLO的同队战友MaNa进行比赛时,已不再是当初稚拙的“菜鸟”,没有再犯前一次比赛中的明显战术错误。在脱胎换骨的AI面前,使用擅长种族神族的MaNa最终也是铩羽而归。
眼看着AI接连战胜两位人类高阶选手,DeepMind又开始对AlphaStar进行了全新的训练——削去它纵览全图的能力,要求它像人类玩家一样必须不断切换地图视野。
又是一周的训练过去,AlphaStar的游戏水平迅速提升。不过,视野受限显然限制了AI选手采取此前惊人策略的能力,并最终在MaNa的猛烈攻势下举起白旗。
但从DeepMind给出的图表可以看出,第二版AlphaStar在受训七天后的水平已经很接近原始版本
目前,全部11场比赛的录像均已在DeepMind官网上释出,供观众下载。针对部分观众的质疑,TLO也给出了回应:
我想对那些说MaNa没打好比赛的人说,相信我,与AlphaStar这样的对手打比赛真的很难,因为它的打法与人类完全不同,我们之前也完全没有经验。
AlphaStar给人留下了极其深刻的印象。在我看来,它还是前所未有的游戏AI。