转载

德扑人机大战收官,人工智能毫无悬念地获胜

德扑人机大战收官,人工智能毫无悬念地获胜

匹兹堡赌场的人机大战终于尘埃落定。

人工智能赢了,却没有带来爆炸般的热议。虽然一开始营造的氛围甚是强大,但似乎大家从始至终都更相信AI程序的赢面更大。虽然有人期待人类反杀逆袭,但最终也没能实现。观众对这样的结果已经习以为常。而仅仅10个月前,阿尔法狗和李世石的对弈结果则要轰动地多。阿尔法狗压倒性的胜利也开启了全面热议AI的时代。

在这场比赛开局之初, 36氪就报道过这场人机大战 ,并预测结果:虽然在某些回合中,人类选手会占得上风,但是在12万手的交锋中,机器大概率会成为赢家。

正如我们所料,当地时间 1 月 30 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的AI程序Libratus 击败人类顶级职业玩家。

这次比赛时长为20天,Libratus和4名顶级人类玩家Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou,玩12万手,胜者将获得20万美元的奖金。

这场比赛的一大看点在于,德州扑克是信息不对称的博弈。与围棋、国际象棋不同,每个选手只能看到自己的手牌。因此,在比赛的策略上, Libratus采用纳什均衡的办法 。纳什均衡追求的是最安全而不是最极致的利益。在这一策略当中,只要其他玩家的策略保持不变,单一玩家就无法通过变换策略获益。

不完整信息博弈被看作是难以攻克的计算机难题。早在2015年时,CMU的AI程序Claudico就在无限下注的比赛中跟4位德扑顶尖高手交过手,共计进行了8万手。不过,在这一次比赛当中,AI程序被狂虐,排在倒数第二名。

这一次CMU的Libratus完美复仇,可以看作人工智能在不完美信息博弈方面的一个里程碑。

Libratus不仅可以执行既定的策略,也可以通过不断学习来灵活应变。Libratus的开发者之一Tuomas Sandholm曾透露,“Libratus的算法一直在超级计算机上运行,所以超级计算机每天都在输出改进的策略。”

在前三轮比赛失利后,四位职业牌手在第四天和第六天的比赛中获得大胜。Libratus原本领先193,000美元,第六轮比赛后,Libratus已经仅仅领先51,000美元。但是,Libratus随后再次获得压倒性胜利。到第10天结束时,Libratus已经领先677,000美元。这就是机器学习结果的结果。半程结束后,局势几乎已经难以扭转了。最终比赛结果的悬殊,也让人感到无力回天的绝望。

德扑人机大战收官,人工智能毫无悬念地获胜

虽然,没有人确切知道机器下一步会做到什么,但是肯定人工智能会在一个又一个的领域里击败人类。人工智能的每一次进步也都会引起一些担忧。在阿尔法狗战胜李世石的时候,就有人担心AI会不会控制人类,人类的末日来临了吗?对于人类和AI的关系,联想CTO芮勇的看法则要豁达得多:

其实人和机器擅长的地方很不一样。机器强的地方在于它的记忆非常强大,它的运算能力非常强大,和人的左半脑非常相似。但是人还有很强的右半脑,右半脑抽象力、想象力、创造力都非常强大。苹果砸到牛顿头上的时候,右半脑就开始想它为什么会掉下来呢?是不是有什么引力?但是苹果砸到机器上,一点反应都没有。所以 人类和机器的关系并不是人和机器去PK,而是人和机器加在一起,成为更强大的人类。

原文  http://36kr.com/p/5062865.html
正文到此结束
Loading...