转载

AI通过阅读理解学习人类价值观

  如何防止 AI 干出不利于人类的事情?阿西莫夫在机器人系列中设定了三个法则,但正如阿西莫夫自己所描述的,机器人是可以不违反特定法则的情况下违反法则意图的。如果人类程序员难以枚举所有的人类价值,那么是否可以让 AI 去学习人类价值?

  美国乔治亚理工学院的 Mark O. Riedl 和 Brent Harrison 发表了一篇论文(PDF),描述了让 AI 阅读和理解故事去学习人类的价值。Riedl 教授说,他们在虚拟环境中模拟运行了数千次,每一次 AI 的行为如果与故事中描述的行为相似,那么它们将会奖励,否则将会得到惩罚。通过奖励和惩罚,AI 将学会偏爱做一些事情,避免做另一些事情,AI 学会像人类那样执行一个任务。Riedl 教授称,AI 还没有学会不要去偷东西,但它在阅读之后学会了不喜欢偷东西。

正文到此结束
Loading...