转载

发表于 2018年06月10日
浏览 (1,723)
评论 (0)

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

近日，阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型 DFSMN，将全球语音识别准确率纪录提高至 96.04%（这一数据测试基于世界最大的免费语音识别数据库 LibriSpeech）。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发，并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的 LSTM 模型，DFSMN 模型训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了 3 倍，语音识别速度提高了 2 倍。

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

图：阿里在 GitHub 平台上开源了自主研发的 DFSMN 语音识别模型

在近期举行的云栖大会武汉峰会上，装有 DFSMN 语音识别模型的“AI 收银员”在与真人店员的 PK 中，在嘈杂环境下准确识别了用户的语音点单，在短短 49 秒内点了 34 杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家，西北工业大学教授谢磊表示：“阿里此次开源的 DFSMN 模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和 AI 技术应用都有巨大影响。”有业内人士称，DFSMN 有望成为继传统的 LSTM 模型后，成为全球语音识别领域最主要的声学识别模型之一。

来自: 网易科技

扩展阅读

2017云栖大会展示互动现场吸引了400多家企业参加
量子计算、区块链、自动驾驶将如何影响世界？15位科学家出预测
深度盘点国内四大机器学习开源平台：PaddlePaddle,Angel
阿里云宣布开放开源AliSQL数据库性能可提升70%
阿里巴巴消息中间件RocketMQ正式成为Apache孵化项目

为您推荐

前端篇: 前端演进史
AlloyTeam：致我们终将组件化的 Web (多图)
利用HTML5与jQuery技术创建一个简单的自动表单完成
最全面的前端开发指南
10个最佳的HTML5代码段，以简化您的开发任务

更多

阿里达摩院
DFSMN
开源软件

正文到此结束

所属分类：开源软件

本文标签： 企业 id 测试 sql 软件 http 科技 GitHub 开源 MQ web 阿里巴巴 HTML DDL 突破数据语音识别深度学习 apache 装备智能 src 模型 https 开源软件开发免费云数据库代码 lib RocketMQ git jquery 阿里云地铁 HTML5
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

配置虚拟站点

浏览(10,119) 评论(20)
修改上传文件权限

浏览(11,522) 评论(18)
VPS 自我监控

浏览(10,329) 评论(23)
OpenVZ VPS 额外支持

浏览(10,402) 评论(17)
openfire数据库安装指南

浏览(19,885) 评论(0)
openfire协议支持指南

浏览(9,329) 评论(18)
openfire定制指南

浏览(11,441) 评论(17)
Caffe 深度学习框架上手教程

浏览(15,621) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(16,413) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(16,243) 评论(0)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG