转载

阿里云iDST人工智能打败全球速记亚军

阿里云iDST人工智能打败全球速记亚军

阿里云年会现场,图中左边屏幕显示的是语音识别,右边屏幕显示的是人工速记

  继 AlphaGo 挑战李世石4:1 获胜之后,阿里云也在人工智能领域向人类发起挑战。

  近日,阿里云在 2016 年会上公开展示实时语音识别技术,并现场挑战世界速记大赛亚军得主。据现场最终评测,机器人在准确率上以 0.67% 的微弱优势战胜第 50 届国际速联速记大赛全球速记亚军姜毅。

  从现场效果看,人工智能的稳定性和并发计算能力是其优势。人类的体力是有极限的,尤其是在高强度压力下,工作时间越长出错概率越大,而机器则能自始至终保持同一水平。这一点在 AlphaGo 和李世石的围棋比赛终中也反复得到验证,在比赛中、后局机器的稳定计算能力远超人类。

  此外,人工智能的并发能力也非人工所能及。在发现错别字后,机器可以瞬间修改所有错误,人工速记则需要在演讲人短暂间歇的时刻返回修改,明显表现得慌乱。

  阿里云 iDST 语音组总监鄢志杰表示,虽然已经在接近世界一流的“速记师”的路上,但人工智能还有很长一段路要走。“在噪声、口音以及对未见到过的数据的适应性上,人类显然更胜一筹。”

  速记师姜毅则评价,虽然和人工智能比赛压力很大,但“机器还是缺了一点点智慧”,并表示非常愿意收下这个“机器徒弟”,教会它更多的速记诀窍。

  “看起来是机器挑战人类,其实是人类在挑战自己。”姜毅强调,“人工智能背后凝结的科学家智慧是人类的骄傲。”

  第 50 届国际速联速记大赛于 2015 年在匈牙利布达佩斯举办,姜毅作为中国代表队的九名选手之一,在文本看打速记比赛项目中以大约 300 字/分钟的速度获世界亚军。

阿里云iDST人工智能打败全球速记亚军

  姜毅在会议现场和看不见的机器人 PK

  核心算法+GPU 计算

  所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。

  随着自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口,苹果 Siri 等是个人智能助理类典型应用。而语音识别则是人机交互的第一步。

  据介绍,此次“人机大战”的语音识别算法主要基于 BLSTM(双向长短时记忆神经网络),这种算法对单位时间内的计算量要求很高,因此阿里云采用了带 GPU 加速的新一代高性能计算平台,单节点计算能力达 16 Tflops,并且对 BLSTM 算法做了针对性优化,实时解码更为顺畅。

  走出实验室赋能应用

  阿里云 iDST 智能语音团队拥有世界一流的专家团队,此次年会展示的研发成果只是冰山一角。实际上语音技术已经走出实验室,在阿里内部广泛应用,比如赋能阿里集团客服和蚂蚁金服客服团队的呼叫中心智能化。

  去年双 11,蚂蚁金服 95% 的远程客户服务已经由大数据智能机器人完成,同时实现了 100% 的自动语音识别。蚂蚁金服客户中心整体服务量超过 500 万人次,客服人员的精力可以更好地集中到处理复杂类客户问题和工作。

  同时,语音团队还把智能语音交互技术赋能给 YunOS 以及手机淘宝、支付宝、钉钉等移动端应用。

正文到此结束
Loading...