转载

Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

“珍珠港遭到空袭!这不是演习!这不是演习!这不是演习!”

——2016 年 1 月 28 日凌晨

  从 28 日开始,一条声称某 AI 在 19 路棋盘上分先战胜樊麾二段,并且论文已登上 Nature 的消息刷爆了朋友圈。一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余 7 段还查验到其论文尚未被 Nature 审核通过。

  然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。围棋圈内的各种微信群、朋友圈都在不断地争论,相信的人越来越多,不信的人也坚持己见。

  终于,在接近凌晨两点,又一条最新报导来了,这次还附带着棋谱:《面对 Google 围棋 AI,人类最后的智力骄傲即将崩塌……》(虽是真消息,但稍有标题党之嫌)至此,看到棋谱的所有人几乎都相信了:人工智能 AlphaGo,实现了里程碑式的一步。

  首先,在客观上要肯定 AlphaGo 实现的水准进步

  樊麾二段,虽然以欧洲冠军闻名于世,但其实圈内谁都知道他是一名中国旅欧教学的职业棋手。

  虽然远离东亚职业一线,但樊老师的水准仍然是不容置疑的,他依然有着职业的水准(虽然是较弱的职业),一般的业 6 仍然是比不上他的。

  AlphaGo 在正式比赛中对樊老师 5:0(棋谱已可见),据说加上非正式比赛的总分为 8:2(已确认),再加上棋谱里 AlphaGo 显示出的惊人表现,我们可以认为,人工智能在围棋上的水准已经迈入了职业的大门。

  说的更明白点,之前的 AI 在蒙地卡罗树状搜索的帮助下虽然取得了革命性的进步,战胜了绝大多数的人类,但人类中能战胜那些 AI 的人数可能仍然在近百万的级别。

  而自今日(其实已经是 3 个月前了)的 AlphaGo 起,能在围棋盘上战胜 AI 的人类人数可能已经不到千人了。

  按照 Facebook 人工智能研究院田渊栋老师的说法,这个消息在相关研究圈内应该早就不是新闻了。

  甚至回想一下 28 日扎克伯格在 Facebook 上突然发声支持自己的研究团队,也因为是知道了 Google 团队的成果即将发布,所以想要抢占一个在舆论的位置。

  (田老师参与的 Facebook 的研究团队,是 Google 现在最大的竞争对手,田老师他们使用的方法应该不太一样,虽然他们暂时落后,但我同样也很期待他们的下一步进展)

  总之,从事实看来,这不是演习已经是显而易见的事实。

  接下来谈点个人对人工智能的粗浅理解。

  蒙地卡罗树状搜索之后,我看到了新天地

  近些年来,尽管在蒙地卡罗树状搜索的帮助下,AI 实现了革命性的进步,达到了能战胜大部分人类的水准(中等业余 5 段),但随着摩尔定律的走向终点,电脑硬件的发展速度在旧有道路上暂时无法按以前的速度爆炸发展下去,大家都认为仅凭蒙地卡罗树状搜索是无法帮助 AI 战胜人类的。

  依据个人的理解,我曾将围棋的思惟过程分解为四步的演进:常识→棋感→计算→判断。

  大约一年前,我曾和李喆七段就此问题进行过简单讨论,当时我认为蒙地卡罗树状搜索的成功主要在于为人工智能建立了“棋感”,而以往的人工智能只能在“常识”和“计算”具有天然优势。

  在蒙地卡罗树状搜索之前,虽然电脑凭藉强大的计算力可以积累大量“常识”,但由于“棋感”的缺失,人工智能无法对计算方向进行有效的筛选,最终就不免沦于蛮力搜索。

  而蛮力搜索虽然可以在一定程度上实现高水准的“计算”,甚至很多其他棋类都在这一环节上被人工智能打败,而由于围棋的过度复杂和摩尔定律结束对电脑发展前景的限制,走到这一步仍然无法让人工智能战胜人类。

  Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

▲ 上图为电脑眼中的国际象棋落子思路,而下图为电脑眼中的围棋落子思路。(Source:Google deepmind 官网 AlphaGo Google DeepMind)Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

  而蒙地卡罗树状搜索出现后,凭藉大量储备的棋局,透过胜负概率来判断下一步着点以做为计算方向,极大的提高的计算效率,所以 AI 的水准才完成革命性的进步。

  而这次的 AlphaGo,使用了深度神经网络与蒙地卡罗树状搜索相结合的方法。

  依据已经能看到的 Nature 上的论文,研究者们在 AlphaGo 中加入了两个深度神经网络,以 value networks 来评估大量的选点,而以 policy networks 来选择落子,并且开发了一种新式算法来结合蒙地卡罗树状搜索和以上两个神经网络。

  Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

▲ 上图为 AlphaGo 使用的神经网络结构示意图,来自原论文。

  在这种结合下,研究者们结合参考人类职业对局的监督式学习,和 AI 大量积累自对弈实现的深度学习,来训练和提高 AI 的围棋实力。

  在蒙地卡罗树状搜索之后,我看到了新的天地。这种结合以及新式的思路,让人感到前景无限。

  最后谈一谈,我认为我们应该保有的态度。

  如何面对人工智能?

  这里,我首先想引用李喆七段说的话:

“我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”

  从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”直到另外两位一线棋手告诉他,已经可以看到棋谱了……

  面对这个事件,接下来将会有很多的爆炸性新闻报导,以及各种各样的讨论。

  我们要知道:

  一.人工智能的确实现了很大的进步。

  这次的进步可能是革命性的,这次新闻宣称的 AI 取得的成绩并不是“标题骗人”。

  二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题骗人”)

  但朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好 AI 下一步发展的情况下,来了一个突然袭击(Google 从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。

  三.人工智能战胜人类的时点,可能比很多人想像的要来得更早了。

  不是之前设想的生物电脑或者量子电脑出现后,甚至都不是新材料取代矽芯片之后,在这个时代就有可能出现了。也许是 50 年后,也许是 20 年后,甚至可能是 10 年后。

  从小学时开始,我就痴迷于许峰雄教授对于电脑国际象棋项目的研究和成就,一直追踪到 97 年“深蓝”战胜卡斯帕罗夫。(就是在那之后不久,我才从国际象棋转投了围棋……)  

Google AlphaGo的胜利:不是电脑打败人类,而是人类打败人类

▲ 上图为第一个打败人类的电脑国际象棋程序“深蓝”之父许峰雄。

  许教授离开 IBM、前往亚研院并声称准备致力于做为最终问题的电脑围棋难题之后,我仍然一年年期待着许教授的后续动作。

  然而十多年过去,等来的却是无数的后来者。

  这也挺好,人类就是不缺后来者。

  看许教授对当年研究过程的讲述,最大的感受就是:

其实并不是电脑打败人类,而是人类打败人类。

  大量的电脑专家,配合大量的国际象棋职业棋手,在算法上不断革新,再搭乘上摩尔定律的东风,不断的失败再重来、输了再修正,最终才解决了电脑国际象棋难题。

  卡斯帕罗夫,是败给了数以百计人类专家的智能。

  围棋也会是一样,电脑——今天说人工智能更合适,战胜人类的那一天迟早会来,大部分人都从来不否认这一点。

  争论,始终在于这一天的早晚。

  而棋手和围棋从业者们,出于可以理解的感情,总是希望并认为这一天不会来得那么快,但他们绝对不会拒绝甚至仇视这种进步。

  其实我看到的很多人,都一直期待并赞许着人工智能的进步,甚至很多职业高手还亲身参与和帮助着电脑围棋项目的研究。我们努力打造着一个“大玩具”,一个能战胜自己的“大玩具”。

  所以最终的成功,是我们人类自己的成功,而不应该对电脑感到恐惧。

  同时,这“大玩具”也不只是好玩而已,人工智能对于现代乃至未来科技的发展有着极大的意义,这意义甚至会超出当年原子弹研究的后续红利。

  所以不要害怕,不要烦恼,让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。

  我之前一直认为在我有生之年是看不到这一天的,然而现在看来,我错了。

  我一点也不失望,反而感到很兴奋,很激动,并且期待以 Google 和 Facebook 为首的前沿研究团队们的进一步的表现。最后的最后,恭喜 Google,恭喜围棋,恭喜人类。

正文到此结束
Loading...