转载

AlphaGo创始人：李世石帮助我们寻找缺点

　　北京时间 3 月 13 日下午 4 点 44 分，人机大战五番棋大战第四场结束，世界围棋冠军李世石执白在第 78 手下出“神之一手”战胜 AlphaGo，在五局比赛中首次获胜，但总比分仍以 1 比 3 落后。双方的第五场比赛将于下周二中午 12 时举行。

　　针对此次李世石的胜利，AlphaGo 创始人哈萨比斯表示李世石再次向大家证明他是一个传奇：“李世石是一个出色的棋手，他对于 AlphaGo 表现的非常好，AlphaGo 最开始的时候表现的还是不错的，我们以为他会在中盘的时候非常好，但是因为李世石给我们的 AlphaGo 带来很大的压力，所以说最后他没有表现好。但是我们非常高兴，这就是我们来到这的原因，我们要测试 AlphaGo 的极限，找到 AlphaGo 有没有什么样的弱点，通过这样的方式我们在能够不断的改善我们的程序。”

　　哈萨比斯还表示：“AlphaGo 一开始它是自己跟自己比赛，然后进行学习，这就意味着他有可能知识上还有缺陷，但是我们之前是没有合适的棋手帮我们找到这个缺陷，我们来到这里就是要找到一个很好的棋手帮助 AlphaGo 找到他的缺陷。李世石先生的确推动了 AlphaGo 展现了自己的缺点，对于我们来讲这是非常有价值的。”

　　此外，现场解说嘉宾麦克雷蒙表示这是一场有趣的比赛：“在比赛的中间部分，就是 78 手下李世石下的非常好，而且我有点惊讶。我想多数的对手都会感到惊讶，特别是 AlphaGo 也感到惊讶，这样的一手实际上最终达到了中腹这部分能够获胜，这就是展现了李世石很有实力。”

　　针对 AlphaGo 在专业人士看来是错误的的问题，哈萨比斯回应称 AlphaGo 是原型的程序：“没有到 beta 程度，只是在阿尔法阶段，因此我们就是要来看一看他有什么样的缺点，得在真正的围棋比赛当中看到这一点。李世石是顶尖棋手，能够帮助我们找到这样的缺点，因此我们的确打了一场非常不错的比赛。医疗是不一样的东西，我们要更进一步的测试这个软件，我们这样一个软件是在原型的阶段，所以我们来到这里进行测试，这就是我们现在的情况。”

　　针对 AlphaGo 头一次认输的问题，哈萨比斯回应称：“AlphaGo 通过计算胜利的可能性选择有哪一手，要增加胜利的可能性，如果胜利的可能性低于阈值的话就认输，它会告诉操作员。AlphaGo 是跟人一样认输的。AlphaGo 总是认为他的对手可能下出最好的手，所以说他这样的计算就是要增加他最有可能胜的这样一些胜率，就是他这一手跟他的原则是一致的，不管对手是什么样的水平。”

　　在比赛中有评论称李世石和 AlphaGo 信息不对称，对此哈萨比斯回应称：“AlphaGo 不是针对李世石来进行训练的。我们用人类的棋局来培训它的，主要是从互联网上下载了一些业余的棋谱对它进行训练，这些都是日常开展的。我觉得 AlphaGo 是通过自我的学习，不断的对弈，来不断的成长的。我们并没有专门就李世石对它进行培训。即使我们想要针对李世石对它进行培训的话，AlphaGo 也需要几百万的棋局对它进行培训，如果只是 100 场是没有办法对它进行很好的培训的。因为它是需要几百万，上亿的培训。”

正文到此结束