为什么AI能在围棋界称雄却无法攻克翻译高地?

为什么AI能在围棋界称雄却无法攻克翻译高地?

  【腾讯科技编者按】科技博客 VentureBeat 近日撰文称,近些年来,人工智能已经从理论应用领域破壳而出,机器学习技术渗入了智能汽车、视频游戏、数字营销、虚拟助手和聊天机器人产品。随着 AI 影响力的不断扩张,它们会继续打破原有力量平衡,让某些行业旧貌换新颜。今天下午,柯洁在与 AlphaGo 的第二局比赛中投子认输,机器已经彻底笑傲棋坛。不过,在最近今年 2 月的另一场翻译人机大战中,AI 却没能战胜人类。那么,未来机器同样会让人类翻译失业,搭起全人类无障碍交流的“巴别塔”吗?

  棋类游戏人类全面溃退

  想得到这个答案,我们必须先了解 AI 和机器学习是如何一步步战胜人类的。1996 年,IBM 的深蓝电脑首次挑战国际象棋大师卡斯帕罗夫,初次交手卡斯帕罗夫获胜。不过,沉寂一年后卷土重来的深蓝却赢了第二场比赛。在那之后,计算机又有了长足的发展,国际象棋领域,人类已经再难与其叫阵。

  深蓝挑战卡斯帕罗夫 20 年后,AlphaGo 横空出世,它在最难攻克的围棋上4;1 战胜了韩国高手李世石,惊掉了全世界的下巴。随后,AlphaGo 又化身 Master,在互联网上取得了 60 场不败的战绩。而今天,升级版的 AlphaGo 在比赛中已经2:0 领先柯洁。

  机器翻译已经发展到 3.0 时代

  现在,业界开始将翻译看成下一个突破口。语言的生成和翻译对机器来说一直是最复杂的挑战,上世纪 50 年代 IBM 就试图打破这一藩篱,但直到上世纪 90 年代,搜索引擎 Altavista 才推出了真正的翻译工具。不过,机器翻译有自己的局限,它只能“翻字典”逐个单词进行翻译,缺乏背景知识的它大多数时候翻译出来的都不像人话。

  机器翻译之后,我们进入了统计机器翻译(SMT)时代。它会利用模型将语段中的单词或句子与此前的翻译进行对比,然后再找出最合适的表达方法。

  随着机器学习和 AI 的介入,机器翻译将进入第三个阶段。与人类大脑类似,机器需要在语境背景下理解不同句段的使用方法,随着学习的深入,它们也能生成可理解的目标语言。

  为此,谷歌专门开发了神经机器翻译(NMT)技术,该技术会以整个句子为单位进行理解(此前为单词和词组)。在 AI 的助力下,NMT 也能从翻译资料中汲取“养料”,它能快速分析语段结构并发现语义或结构转换的微妙之处。

  短期内人类翻译不会丢饭碗

  技术进步飞快,许多靠语言吃饭的人开始担心 NMT 带来的巨大威胁,但对于普罗大众来说,能打破语言的藩篱确实令人期待。

  今年 2 月份,谷歌全新 NMT 系统在韩国世宗大学与人类译员进行了一场大战。整个比赛耗时 50 分钟,人类和机器都要翻译两段随机文本(未翻译过的),一段文学的,一段非文学的。在这次比赛中,人类以巨大优势战胜了机器,韩译英和英译韩上机器都没占到半点便宜。

  有人会说,翻译可不像数学计算或者下围棋,评委在评判时可能会戴着有色眼镜。不过,这次比赛第三方裁判主要着眼于母语者一眼就能看出的语言错误,因此我们没有理由怀疑比赛的公平性。

  赛后,评委表示,NMT 系统翻译出的文本 90% 语法都有问题,或者说它会翻译出一些没有明显错误但不符合人类语言习惯的语句。这场大战后,许多靠语言吃饭的人都能松口气了。

  不过从长远来看,NMT 未来确实可以胜任一些技术类的文本内容,此类文本有严格的写作规范且术语众多。当然,即使是此类文本,NMT 翻译后人类也要对其进行一定的校对和修改。

  至于文学和营销翻译,恐怕最先进的 AI 也无能为力,因为此类文本的译文需要翻译根据实际情况进行再创造(如苹果“Think Different”的广告语翻译成“非同凡想”)。因此,在翻译和语言的世界中,机器人还有很长的路要走。

本站部分文章源于互联网,本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供。如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。

PS:推荐一个微信公众号: askHarries 或者qq群:474807195,里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多

转载请注明原文出处:Harries Blog™ » 为什么AI能在围棋界称雄却无法攻克翻译高地?

赞 (0)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址