终极人机大战要来了?AI打星际2即将直播,DeepMind暴雪发出神秘预告
DeepMind CEO哈萨比斯说,星际2是一款复杂的实时战略游戏,对AI来说是一个长期的巨大挑战。我们将展示我们的进步!你肯定不想错过直播! :-)
不少网友都纷纷表示,要看!哪怕是上了一天班之后,熬夜也要看!绝对不容错过。
甚至在Reddit论坛上给自己设提醒:两天后提醒我!42小时后提醒我!
更有网友当场“深情表白”:当DeepMind宣布他们开始打星际的时候,我也开始玩了,只是为了更好地欣赏这种深奥的技术。
在一些人看来,这是一个时代的结束。最初,它们是为了我们的象棋&围棋,现在是为了我们的星际争霸。
怎样迎接这样的一个时代?有人说自己已经感觉到恐惧了。也有人为DeepMind的发展制定了规划:第一步,精通星际;第二步,精通魔兽世界;第三步,精通企业战略咨询。
也不乏有好事者评论道,它跟OpenAI打Dota的AI相比怎么样?放一起“干架”肯定很精彩。
好事者问道:2019年DeepMInd和OpenAI会来一场吗?
不过,也有一些网友不服,表示如果DeepMind能够打赢职业选手,当场吃鞋!还引发了其他网友的附和。
还有专业的网友,在猜测DeepMind攻克星际2究竟用了什么技术。大家也可以一起来猜一猜,下面是他列出的选项:
2016年11月暴雪嘉年华上,DeepMind工程师宣布了训练AI打星际2的计划。算起来到现在已经两年多了。
DeepMind与暴雪合作的目标之一,就是开发一套足够好的人工智能系统,使之可以击败星际2人类选手。就像AlphaGo击败李世乭、柯洁一样。
然而,最终的目标是将其中使用的技术应用到现实世界,而不是让它始终停留在游戏里面。
与国际象棋或围棋不同,星际玩家面对的是不完美信息博弈。“战争迷雾”意味着玩家的规划、决策、行动,要一段时间后才能看到结果。
“在星际2中,这非常重要,但却很微妙,可以将未来与过去联系起来。”他说,“很难建立因果关系,因为游戏中会发生很多事情。”
连著名的AlphaGo“人肉臂”黄士杰,也已经转到星际2的项目中。很多人认为在即时战略游戏中,AI的反应速度会成为极大的优势,但事实并非如此。
黄士杰此前解释称,围棋只有361个落子点,对AI来说全部游戏内容都是可见的。但星际2游戏有大量全黑的地图,玩家需要探索地图以及侦查对手动向,才能制定相应的策略。
几乎每次鼠标移动,都能视为一次落子。这种不确定性让星际2对AI来说,难度比围棋要高很多。
这有一段6分钟的视频,配好了中文字幕,能更直观一点的解释AI打星际2到底是怎么回事。
星际2的AI大战进展
为了教AI打星际2,暴雪和DeepMind在2017年8月,发布了星际2中加速AI研究的工具SC2LE。GitHub的传送门在这里:https://github.com/Blizzard/s2client-proto
工具包推出同时,他们还开源了一套星际2的迷你游戏,是星际2部分操作的抽象产物,AI能从中练习移动、采矿、建造单位等等技能。
到2018年6月,DeepMInd终于宣布,用关系性深度强化学习搞定了这些小游戏,在六个小游戏中达到了当前最优水平,其中4个还超过了大师级人类玩家。
想更深入了解可以阅读这篇论文:Relational Deep Reinforcement Learninghttps://arxiv.org/abs/1806.01830
腾讯实际上开发了两个AI,基于扁平化动作结构的深度强化学习智能体TStarBots1,和基于分层动作结构规则控制器的智能体TStarBots2。
这两个AI都能在完整对战中击败等级1~10的游戏内置机器人(1v1虫族对抗,地图:深海暗礁