(6月21日):谷歌的 AI 一直朝着超神的道路走去。自从在围棋上击败李世石之后,谷歌的 DeepMind 小组并没有停下,接下来他们要挑战的内容是 3D 导航和益智解谜游戏。在 DeepMind 的挑战中,最值得注意的是一款名为“蚂蚁足球”的游戏。玩家需要控制一只蚂蚁形状的物体去追逐小球,然后带球直至将其送进球门得分。这种事对于人类来说可 谓易如反掌,就看 DeepMind 怎么做了。
根据 DeepMind 小组 David Silver 说法,AI 不仅完成了这个挑战,最令人惊讶的是它在整个过程中“完全不需要提前灌输有关力学的任何知识”。这个结果表明,谷歌提出的强化学习(Reinforcement Learning)概念近来又有了巨大的突破。
为了得到这样的结果,DeepMind 结合了强化学习、神经网络深度学习和 Deep Q-Network 于一体。专门有一个算法负责存储机器人的经验积累,以及在完成某个特定行为后它的奖励预期。其实这也的算法早在 DeepMind 完成 2D 游戏挑战时就已经得以应用,不过 Silver 说它现在已经得到改进,比以前好得太多。
举个例子,该算法现在能够允许单个神经网络去学习多个游戏。为此研究组打造了一个大型分布式深度强化学习系统,能够利用谷歌的云平台来加速训练时间。值得注意的是,该技术已经被运用在谷歌的推荐系统中了。
不过,真正能够让 DeepMind 学会玩这个“蚂蚁足球”的关键在于谷歌最新开发出的所谓“异步 Actor-Critic 算法”,即 A3C。在解决电机控制和使用视觉在随机 3D 迷宫中导航的问题上,采用这个算法的话标准多核 CPU 较之 GPU 效率更高。
David Silver 表示,DeepMind 现在达到的成绩可以说是最尖端的了,这样能够在训练时间和资源消耗上达到一个平衡。
随着 AI 技术的继续发展,人类会受到威胁吗?事实上谷歌也有类似的担忧,DeepMind 小组曾表示他们担心 AI 会自己发展出一套它们认为可以达到目的,但却不是人类想要的方案来完成目标。
为此,DeepMind 小组已经开发出了一种机制,据说可以无视 AI 的任何行动直接使其失去作用。尽管并不清楚具体的原理,但我们似乎可以无需为此过分担心了。关于 AI 会不会带来毁灭性后果的问题,业界中一直有着激烈的争论。不过对于我们每个人来说,这似乎还不是值得去认真忧虑的事情。