转载

AI通过阅读理解学习人类价值观

　　如何防止 AI 干出不利于人类的事情？阿西莫夫在机器人系列中设定了三个法则，但正如阿西莫夫自己所描述的，机器人是可以不违反特定法则的情况下违反法则意图的。如果人类程序员难以枚举所有的人类价值，那么是否可以让 AI 去学习人类价值？

　　美国乔治亚理工学院的 Mark O. Riedl 和 Brent Harrison 发表了一篇论文（PDF），描述了让 AI 阅读和理解故事去学习人类的价值。Riedl 教授说，他们在虚拟环境中模拟运行了数千次，每一次 AI 的行为如果与故事中描述的行为相似，那么它们将会奖励，否则将会得到惩罚。通过奖励和惩罚，AI 将学会偏爱做一些事情，避免做另一些事情，AI 学会像人类那样执行一个任务。Riedl 教授称，AI 还没有学会不要去偷东西，但它在阅读之后学会了不喜欢偷东西。

正文到此结束