转载

谷歌的AI现在能踢“足球”了它是如何做到的

　　谷歌的 AI 一直朝着超神的道路走去。自从在围棋上击败李世石之后，谷歌的 DeepMind 小组并没有停下，接下来他们要挑战的内容是 3D 导航和益智解谜游戏。在 DeepMind 的挑战中，最值得注意的是一款名为“蚂蚁足球”的游戏。玩家需要控制一只蚂蚁形状的物体去追逐小球，然后带球直至将其送进球门得分。这种事对于人类来说可谓易如反掌，就看 DeepMind 怎么做了。

　　根据 DeepMind 小组 David Silver 说法，AI 不仅完成了这个挑战，最令人惊讶的是它在整个过程中“完全不需要提前灌输有关力学的任何知识”。这个结果表明，谷歌提出的强化学习（Reinforcement Learning）概念近来又有了巨大的突破。

　　为了得到这样的结果，DeepMind 结合了强化学习、神经网络深度学习和 Deep Q-Network 于一体。专门有一个算法负责存储机器人的经验积累，以及在完成某个特定行为后它的奖励预期。其实这也的算法早在 DeepMind 完成 2D 游戏挑战时就已经得以应用，不过 Silver 说它现在已经得到改进，比以前好得太多。

　　举个例子，该算法现在能够允许单个神经网络去学习多个游戏。为此研究组打造了一个大型分布式深度强化学习系统，能够利用谷歌的云平台来加速训练时间。值得注意的是，该技术已经被运用在谷歌的推荐系统中了。

　　不过，真正能够让 DeepMind 学会玩这个“蚂蚁足球”的关键在于谷歌最新开发出的所谓“异步 Actor-Critic 算法”，即 A3C。在解决电机控制和使用视觉在随机 3D 迷宫中导航的问题上，采用这个算法的话标准多核 CPU 较之 GPU 效率更高。

　　David Silver 表示，DeepMind 现在达到的成绩可以说是最尖端的了，这样能够在训练时间和资源消耗上达到一个平衡。

　　随着 AI 技术的继续发展，人类会受到威胁吗？事实上谷歌也有类似的担忧，DeepMind 小组曾表示他们担心 AI 会自己发展出一套它们认为可以达到目的，但却不是人类想要的方案来完成目标。

　　为此，DeepMind 小组已经开发出了一种机制，据说可以无视 AI 的任何行动直接使其失去作用。尽管并不清楚具体的原理，但我们似乎可以无需为此过分担心了。关于 AI 会不会带来毁灭性后果的问题，业界中一直有着激烈的争论。不过对于我们每个人来说，这似乎还不是值得去认真忧虑的事情。

正文到此结束