转载

德扑人机大战收官，人工智能毫无悬念地获胜

匹兹堡赌场的人机大战终于尘埃落定。

人工智能赢了，却没有带来爆炸般的热议。虽然一开始营造的氛围甚是强大，但似乎大家从始至终都更相信AI程序的赢面更大。虽然有人期待人类反杀逆袭，但最终也没能实现。观众对这样的结果已经习以为常。而仅仅10个月前，阿尔法狗和李世石的对弈结果则要轰动地多。阿尔法狗压倒性的胜利也开启了全面热议AI的时代。

在这场比赛开局之初， 36氪就报道过这场人机大战，并预测结果：虽然在某些回合中，人类选手会占得上风，但是在12万手的交锋中，机器大概率会成为赢家。

正如我们所料，当地时间 1 月 30 日，在宾夕法尼亚州匹兹堡的 Rivers 赌场，卡耐基梅隆大学（CMU）开发的AI程序Libratus 击败人类顶级职业玩家。

这次比赛时长为20天，Libratus和4名顶级人类玩家Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou，玩12万手，胜者将获得20万美元的奖金。

这场比赛的一大看点在于，德州扑克是信息不对称的博弈。与围棋、国际象棋不同，每个选手只能看到自己的手牌。因此，在比赛的策略上， Libratus采用纳什均衡的办法。纳什均衡追求的是最安全而不是最极致的利益。在这一策略当中，只要其他玩家的策略保持不变，单一玩家就无法通过变换策略获益。

不完整信息博弈被看作是难以攻克的计算机难题。早在2015年时，CMU的AI程序Claudico就在无限下注的比赛中跟4位德扑顶尖高手交过手，共计进行了8万手。不过，在这一次比赛当中，AI程序被狂虐，排在倒数第二名。

这一次CMU的Libratus完美复仇，可以看作人工智能在不完美信息博弈方面的一个里程碑。

Libratus不仅可以执行既定的策略，也可以通过不断学习来灵活应变。Libratus的开发者之一Tuomas Sandholm曾透露，“Libratus的算法一直在超级计算机上运行，所以超级计算机每天都在输出改进的策略。”

在前三轮比赛失利后，四位职业牌手在第四天和第六天的比赛中获得大胜。Libratus原本领先193,000美元，第六轮比赛后，Libratus已经仅仅领先51,000美元。但是，Libratus随后再次获得压倒性胜利。到第10天结束时，Libratus已经领先677,000美元。这就是机器学习结果的结果。半程结束后，局势几乎已经难以扭转了。最终比赛结果的悬殊，也让人感到无力回天的绝望。

德扑人机大战收官，人工智能毫无悬念地获胜

虽然，没有人确切知道机器下一步会做到什么，但是肯定人工智能会在一个又一个的领域里击败人类。人工智能的每一次进步也都会引起一些担忧。在阿尔法狗战胜李世石的时候，就有人担心AI会不会控制人类，人类的末日来临了吗？对于人类和AI的关系，联想CTO芮勇的看法则要豁达得多：

其实人和机器擅长的地方很不一样。机器强的地方在于它的记忆非常强大，它的运算能力非常强大，和人的左半脑非常相似。但是人还有很强的右半脑，右半脑抽象力、想象力、创造力都非常强大。苹果砸到牛顿头上的时候，右半脑就开始想它为什么会掉下来呢？是不是有什么引力？但是苹果砸到机器上，一点反应都没有。所以人类和机器的关系并不是人和机器去PK，而是人和机器加在一起，成为更强大的人类。

原文 http://36kr.com/p/5062865.html

正文到此结束