人工智能与人类挑战《星际争霸2》,到底有什么意义?

2016-12-01 03:51:36 来源:济宁新闻网

人工智能与人类挑战《星际争霸2》,到底有什么意义?

科技网站 Ars Technica 近日撰文称,暴雪与谷歌 DeepMind 的合作虽然并未在暴雪嘉年华上吸引广泛关注,但这个项目却有着极其深远的意义。

以下为原文内容:

2016 年暴雪嘉年华(BlizzCon 2016)上反响最不强烈的一项声明,恰恰有可能最具革命性。

当天,《炉石传说》、《风暴英雄》、《守望先锋》和《暗黑破坏神3》引得台下的暴雪粉丝阵阵欢呼,但谷歌 DeepMind 将与这家《星际争霸2》的开发商共同促进人工智能研发的消息却只是来了人们的低声抱怨。

热情不足或许源自兴趣缺乏。毕竟,《星际争霸2》的玩家凭什么对人工智能科学家的计划感兴趣呢?然而,倘若 DeepMind 与暴雪之间的合作能够达到开发者的预期,玩家也将从中获得实际利益甚至连很多视频游戏领域之外的人也将获益。

一段时间以来,人工智能已经成为视频游戏中不可分割的一部分。正如《星际争霸2》制作总监克里斯斯嘉蒂(CHris Sigaty)所说,DeepMind 的产品并非暴雪即时战略游戏的第一个人工智能玩家。

各种游戏目前使用的都是脚本化的人工智能程序,这些程序的设计师和工程师都了解游戏的运行方式,他们将自己的能力植入到脚本中,然后向程序传授一系列场景。例如,如果收集到X数量的资源,人工智能就应该在Z部队上花费Y数量的价值。

这些程序制作得都很详细,与他们对战都很有意思:有一些随机的选择,还有一些明确选择。斯嘉蒂说,他们可以拓展疆域,收集资源这都是你需要在《星际争霸2》里做的事情。但这些人工智能程序都是脚本化的。它们的行为可以预测,所以除非作弊,否则这些人工智能程序无法击败人类。

事实也的确如此,最优秀的《星际争霸2》电子竞技选手经常击败人工智能。DeepMind 的目标是开发一种能像人类一样玩游戏的人工智能程序,甚至有可能击败最优秀的人类玩家,从而拓宽深度学习技术的潜力。

DeepMind 团队已经在游戏领域取得了一些成功:该团队的人工智能程序 AlphaGo 今年 3 月以4:1 的比分击败了世界顶尖围棋选手李世石,一举跨过了人工智能以往最大的障碍。

人工智能与人类挑战《星际争霸2》,到底有什么意义?

不只是游戏

DeepMind 研究员奥里奥尔温亚尔斯(Oriol Vinyals)表示,《星际争霸2》可以帮助人工智能取得重大进步,因为这款游戏里的元素不是静态的,而且没有采用回合制,所以有助于为人工智能开发创造基准。

我们认为,《星际争霸2》的复杂度让我们现在可以测试几年前无法处理的算法。他说。

在《星际争霸2》里,玩家取得成功所需的很多信息最初都是隐藏的,所以需要侦查不同的地方,同时还要管理资源,组建部队,以便探知对手的状况。

静态人工智能将屏幕上的活动视作一个个的数据包,而 DeepMind 想要把《星际争霸2》作为一种学习体验,就需要隐藏这些数据这一点跟人类玩家基本相同。

这一过程更加复杂,因为这款游戏隐藏了部队,而玩家也不知道敌人在哪里。他的重点是规划和资源管理,玩家还要考虑他们之前是否与对手有过对抗,以及如何利用这一知识接近对手。温亚尔斯说。

这些都是人工智能面临的艰巨挑战,我们需要在新的环境中处理这些问题。关键在于,即使无法在短期内获得成功,也可以开始构建一个人工智能基准,一步步地推进这项技术。另外,对外开放之后,所有人都可以贡献自己的想法,帮助我们改进流程。

暴雪与 DeepMind 之间的合作并非闭门造车。温亚尔斯在暴雪嘉年华上表示,《星际争霸2》的人工智能研究环境将向所有开发者、业余爱好者以及希望参与其中的玩家开放。

DeepMind 向全球发出号召,因为他们需要整个世界帮助其克服这一重大挑战。ApI 计划于 2017 年第一季度以游戏补丁的方式发布,并将作为免费的 Starter Edition 的一部分提供给玩家。但正如温亚尔斯所说,在正式发布前仍有很多工作要做。

合作最近刚刚启动。他说,第一步是建立环境,让我们可以将人工智能程序植入其中,使之可以在玩游戏的过程中进行观察。我们正在集中所有精力来建造这一环境,因为我们必须向公众发布这个环境。这必须成为其他人工智能研究人员的基准。有很多人在研究人工智能,所以确保他们都能使用这一环境是非常重要的。

下一步是推出这个程序,我们目前只进行了简单处理。

人工智能与人类挑战《星际争霸2》,到底有什么意义?

学习过程

这是一场艰巨的挑战。斯嘉蒂说,必须解决一些重大的问题。对深度学习而言,必须有一套系统,可以使之获得一个与人类看到的内容相似的学习环境。

一旦建立了这样的系统,便可将人工智能引入其中,然后开始学习。为了完成闭环,DeepMind 还需要确保人工智能能够在这个环境中观察和采取行动。

虽然这种闭环的基本结构以前也曾使用过,但《星际争霸2》却可以更加深入地挖掘深度学习的潜力。相比于在雅达利游戏机上左右晃动手柄或者识别 1919 的围棋棋盘,这种技术将实现巨大的进步。

在此之前,你可以从你所关注的游戏中获取数据流,无论是人类玩家与人工智能对战,还是人类玩家之间的对战都可以。斯嘉蒂说。通过这种方式,即可了解游戏中的各种运行规则和模式。

我们正在开发和即将推出的 ApI 无法看到这些数据,因为它并没有进行探索。它把游戏里的数据当做一种视觉格式,于是,一个会学习的人工智能程序可以吸收这些信息,并开始像人类一样玩游戏。他说,这之所以令人兴奋,是因为我们接下来讨论的是神经网络和深度学习。我们并不知道结果会是什么。

如果取得成功,DeepMind 和暴雪都将从中获益。从游戏角度来看,暴雪可以将该项目视作一种改进《星际争霸2》使用体验的方式,抛弃可以预测的脚本化人工智能,提供对发行商及其玩家都更有吸引力的新技术。

我们希望开发出一套没有预先设定的程序,可以通过观察人类玩家的玩法不断学习即便它可能无法达到人类玩家的水平,但仍然可以为玩家提供与以往不同的且变化多端的新挑战。斯嘉蒂说。

这种深度学习有望向人工智能揭开运行模式、常见错误、胜利条件的神秘面纱,还可以揭示出究竟到什么时候,一个玩家注定会胜利,另外一个玩家注定会失败。

最终可以判断某个做法究竟是好是坏但我们现在还无法判断何时才能实现这一目标。斯嘉蒂说,这样就能开发出一个教练,告诉玩家现在建造这个部队比较好。它还可以为正在学习的玩家提供建议,告诉他们哪些人不会知道某些游戏技巧。

电子竞技

斯嘉蒂表示,如果真的能够实现这种水平,就可以解决暴雪及其玩家面临的一些地域问题。电子竞技观察者都发现一个现状:韩国玩家在各类比赛中占据主导,而部分原因在于他们的家庭环境允许其与世界顶尖选手对抗。这一点在《星际争霸2》中体现得尤为明显。其他地方的玩家很少有机会与才华横溢的对手对抗,因此提升的潜力也很有限。

如果这项技术取得成功,玩家水平的提升就不会受到地域的限制,而最顶尖的选手也可以改进自己的水平。斯嘉蒂说,一旦超过某个门槛,就会释放很大潜力。

温亚尔斯认为,使用人工智能的确可以达到这样的潜力,因为游戏领域之外的很多技术问题都非常相似。使用游戏帮助人工智能程序学习如何采取最佳行动是非常明智的,这可以模拟变量众多的复杂环境。

一方面,我们可以同时利用多个数据中心监控许多游戏,测试许多想法。他说,这都可以用游戏分数来衡量这样一来,我们就可以尝试着改进算法。一旦我们认为达到了某种突破,便可以将这些工具应用于现实。

作为人工智能影响现实世界的最新实例,谷歌今年 7 月披露,DeepMind 人工更智能技术帮助该公司将数据中心的电费降低了 40%。人工智能已经可以融入学习环境,并大幅改进系统用电模式。

虽然谷歌通过可再生能源为数据中心供电的计划尚未落实,但 DeepMind 已经向降低能耗和成本的方向迈出了一大步。

这跟游戏很相似。温亚尔斯说,人工智能程序会观察房间不同位置的温度,然后采取优化措施冷却数据中心。最终的方案比这更加复杂:既要减少开支,又不能破坏服务器。但有很多拥有游戏经验的并行程序,因为人工智能程序/环境范式很强大,也很通用。

游戏可以更快地测试和改进算法开发过程。一旦你提取数据,就可以看到更广泛的应用。无论从开发还是研究的角度来看,这都是人工智能的好时候。

虽然听起来有些奇怪,但暴雪与 DeepMind 的合作只是《星际争霸2》非凡历史上的最新节点。该系列游戏的第一版主要是为了应对电子竞技的崛起。由于该游戏在韩国广泛流行,也在一定程度上刺激该国投资建设互联网基础设施。

如今,该游戏又在人工智能的发展过程中扮演了重要角色。这种进步确实令斯嘉蒂感到意外,他从第一代游戏开始就一直任职于《星际争霸》团队。

那么,《星际争霸》接下来又会向什么方向发展?

我不知道!他笑道,或许是在宇宙飞船里玩游戏。我也要去!

济宁IT新闻