转载

Siri,你这么腻害是想上天吗?

6月14号的凌晨1点钟,千呼万唤始出来的2016苹果全球开发者大会(WWDC)在旧金山比尔·格雷厄姆市政礼堂正式拉开序幕。和前几届大会一样,iOS新版本依旧是WWDC上最闪亮的super star,而Siri则是这个super star身上最耀眼的光环。

Siri,你这么腻害是想上天吗?

Siri小百科

Siri,学名苹果智能语音助手。2007年出生于美国,苹果公司于2010年正式拿到Siri的抚养权。随着苹果公司的不断培养,Siri从最初的只能看懂文字逐步进化成了现在的智能语音识别。蠢萌逗逼的个性是Siri吸粉的重要利器。

举个栗子:

Siri,你这么腻害是想上天吗?

Siri,你这么腻害是想上天吗?

你别看Siri平时一副不着调的样子,事实上Siri可是立过不少功的大英雄呢。前几天的澳洲,一位在女儿病情危急时找不到iPhone手机的妈妈就在关键时刻用Siri呼叫了救护车,成功的救回了命悬一线的婴儿。其实这已经不是Siri第一次救人了,早在2015年,Siri就曾帮助过被汽车压在身上不能动弹的小伙子报警向警察求救。

Siri,你这么腻害是想上天吗?

我想谁也不能否认,Siri是一项很不错的技术发明。那么双商均高的Siri究竟是怎么来工作的呢?

Siri的工作原理

Siri善解人意聪明灵敏风趣幽默的秘密就是它了——语音识别。语音识别是一门交叉学科,涉及到的知识领域相当广泛。其实说白了,语音识别技术就是让机器通过识别和理解把我们说的话转化为它们读得懂的话,然后根据机器理解的意思产生相应回馈的一门高科技。

首先我们应该明确的是,语音识别不是一个人在战斗,它的背后一定存在着一个非常庞大的频谱库,这个库中有大量大量大量(重要的事情说三遍)的频谱。这些海量的频谱是语音识别进行工作的重要基础。

Siri,你这么腻害是想上天吗?

众所周知,机器之所以能听懂我们的话是因为它将我们说的话都进行了“加工”,这个加工过程就是根据发音将我们说的每一个字都转化为频谱线。不同的发音有不同的频谱线,这些频谱线与发音是相对应的。尽管不同的人拥有不同的声线,但每个单字的发音大体都是相同的,就像智能手机中的手写功能,尽管大家的字体都有所不同,但还是可以准确辨认出写入的是哪个字。将转换得来的的频谱线与频谱库中的频谱线进行比对,从与之相匹配的频谱线中得到相对应的元音和辅音。得到元音和辅音之后就可以从他们的组合中通过使用频率来推测出单字了。

接下来就是让语音识别最头疼的一件事了,识别语义,就是将推测得到的单字组成句子。你学英语的时候有没有和小编一样的苦恼,单个词都认识,连成一句话就一脸懵逼,不管你是不是,反正语音识别是。同样的字在不同的语境中有不同的意思,最经典的一个示例就是“方便”这个词了,所以识别语义也是目前语音识别技术面临的最大障碍了。

得到了句子之后就是执行的问题了,比如你语音输入的是播放一首大王派我来巡山,手机就会自动的将音乐播放器打开,找到这首歌并播放。这就是语音识别工作的全过程了。

语音识别的未来

其实相比打字,语音交互的优势很明显。人每分钟平均可以说150个单词,打字只能打40个。毫无疑问,未来的输入方式是语音的天下。

Siri,你这么腻害是想上天吗?

语音识别作为下一代交互方式,发展前景相当巨大。比如要去一个陌生的地方旅游,你不需要自己规划路线图、不需要导游的讲解、不需要在自己找酒店,你只需要打开手机上诸如Siri一样的软件然后语音输入就都搞定了。

随着人工智能的发展,语音识别也必定会更加智能化、更加实用。或许未来的某一天,语音识别准确率从现在的95%上升到99%,Siri变成了一个掌握16国语言可以带你穿行各大洲的利器。到那时,那你还会像现在一样不愿带他们玩吗?

Siri,你这么腻害是想上天吗?

Siri,你这么腻害是想上天吗?

【责任编辑:何妍 TEL:(010)68476606】

原文  http://network.51cto.com/art/201606/512909.htm
正文到此结束
Loading...