转载

AlphaGo对李世石“放水”?棋手说不可能!

  就在舆论普遍认为李世石将会继续败北的时候,人机大战的第四场,李世石出人意料地挽回了胜局,将比分改写为“3:1”。比赛开局阶段,李世石始终落后于 AlphaGo,一直在被吊打。然而,第 78 手的时候,局势峰回路转,李世石下出了关键的一步,一招极其冷门下出妙手。对于这一步棋,视频观战的职业棋手古力评价为“神之一手”。

  随后,AlphaGo 一连串的差手让棋面局势利好于李世石。在第 97 步,AlphaGo 再次出现低级失误,所下白子被李世石果断吃掉。最终,经过长达 4 个多小时的鏖战之后,AlphaGo 中盘认输,李世石终于在这场人机大战中赢回“尊严”之战。

AlphaGo对李世石“放水”?棋手说不可能!

  对于戏剧性的比赛结果,雷锋网记者的朋友圈出现了有多种观点看法,其中最有代表性的一种说法是“AlphaGo 选择性放水“。甚至还有阴谋论表示,AlphaGo 今天失利是因为被改代码。那么,AlphaGo 放水的可能性有多大呢?

AlphaGo对李世石“放水”?棋手说不可能!

  雷锋网第一时间针对这一问题请教了围棋界、科学界的专业人士。对此说法, 他们都表示,“可能性为零”。至于李世石第 78 步的落子,完全可以称得上是载入史册的一次妙招!

  业余围棋 5 段的高飞龙表示:

李世石创造了历史,第 78 步棋没有一定水平看都看不懂,很高的职业水准才能想得到。

  棋手鲍云对于李世石第 78 步下法给予了很高的评价:

“配得上最高评价神之一手。

  AlphaGo 程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的 20 来步进入疯狗状态。鲍云表示:

AlphaGo 前半盘大优,不是防水的态度。至于 AlphaGo 第 97 步的表现可以用“疯狗病发作”来形容。78-97 步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97 确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。

  那么,AlphaGo 为何会出现如此明显的异常表现?

  根据 Alphago 原论文第一作者之一的 Demis Hassabis 在赛后的总结,

“李世石下出白 78 后,AlphaGo 自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到 70%,直到第 87 步才反应过来。”

AlphaGo对李世石“放水”?棋手说不可能!

  高飞龙猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78 步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。

  出门问问 NLP 工程师李理也在微信群给出了自己的猜测:

(如果一定要猜测)我觉得可能是开局主要靠 value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。

  同时,他也认为这一“诡异”问题将会比较难解决,

  神经网络打分是固定的,搜索有一定随机性。而 value network 是异步的,调试也不简单,得通宵加班找 bug 了。

  PS.最新消息补充:

  在赛后的记者招待会上,李世石谈到了 AlphaGo 的两个弱点:一个是 AlphaGo 执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是 bug。

  那么问题来了,第 5 场比赛,各位怎么看?是李世石再下一城还是 AlphaGo 4:1 荣耀收关?

正文到此结束
Loading...