人工智能想在《星际争霸》游戏中打赢人类?
作者:本站整理 时间:2016-06-13
据本月13号消息报道,在AlphaGo战胜了韩国围棋棋手李世石后,DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)就曾表示将研究以人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸》。不过目前看来,DeepMind AI要跟人类比赛打《星际争霸》这事,还是有点儿悬。
早在2015年,DeepMind AI就开始用已经雅达利1977年发行的游戏机Atari 2600来进行游戏训练,整个训练过程团队没有提供任何额外信息帮助,全依靠AI自己来一步步学习如何打怪升级。在这些游戏里,有一款游戏始终让 DeepMind AI很苦恼,那就是《Montezuma’s revenge》,这是雅达利一款难度超高的游戏。
后来团队找到了“好奇心”激励机制,来让DeepMind AI获胜。他们给AI变成编程输入“人工好奇心”,在AI探索更多的玩法的时候给予它更多的奖励,鼓励它去用不同的途径来获取更高的分数。在新版本里,DeepMind AI在好奇心的驱动下探索了15个房间的游戏。在没有好奇心的时候,它只玩了2个房间。
今年3月底,在AlphaGo五局四胜赢了李世石之后,暴雪娱乐制作总监Tim Morten就在WCS中国区总决赛上确认,DeepMind AI 将挑战《星际争霸2》,当时Tim Morten就直言DeepMind AI不会在《星际争霸2》中战胜人类。直接目前,这一场人机游戏争霸战,官方都没透露更多的细节。
实际上,《星际争霸》作为一款即时战略类的游戏,给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面,两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据,而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏,《星际争霸》需要在极短时间内执行策略,而围棋相对来说则有充足的时间给AI运算思考。
目前,DeepMind AI想要打赢《星际争霸》还是需要更长的时间学习和摸索。