语音识别技术对于Siri究竟起着多大作用?在 刚Siri发布的时候,Siri 的一个Co-Founder Norman Winarsky 接受 9to5Mac的采访时说道:“语音识别在Siri 中所占的分量,比大多数人想象的要少得多。目前 Siri 用的是Nuance 的技术。但是一旦有更好地语音识别技术出现, Siri 可以很容易更换一个新的”。
现在Wired 带来的消息是,苹果正在着手更换掉 Nuance,打算用自己研发的语音识别技术,最快可能在 iOS 9 中亮相。
Google 和微软都有自己的语音识别技术,并应用于 Google Now 和 Cortana,如今苹果也终于要完成这一步。第三方的技术虽然很容易找到业界最好的,但毕竟是别人家的公司,哪天关闭了也说不定,前段时间就传出三星打算收购 Nuance 呢。
在过去几年,苹果不仅吸纳了 Siri 的语音技术人才,更是将 Nuane 公司的多名高级语音研究人员挖角过来,包括了前研发副总裁 Larry Gillick,以及来自微软语音识别项目高管 Alex Acero,后者在微软工作达 20 年之久。
Siri 的许多智能操作依靠整合大量网络服务 APIs 来完成,包括 OpenTable Tickets.com 等,更重要的是,它还整合了 Wolfram Alpha 智能搜索引擎,后者因“直接提供最佳解决方案而非链接”的设计初衷而被许多评论家称为“Google 杀手”并寄予厚望,这也是 Siri 可以回答结构性知识的原因,但这还不够,Siri 常常令人失望。
为了进一步提高准确率,苹果打算利用神经网络来提升语音识别率,这是一种十分炫酷的技术,将机器学习的方式模仿人类大脑的神经元,当处理的话语越来越多时,这种网络就可以逐渐理解话语。实验结果发现,这种技术可使得精确度提升 25% 以上,这是一个巨大的飞跃,因为这个行业只需要提升 5% 就具备革命意义了。
目前 Google Now、Skype Translate 都采用了这种算法,微软研究部门主管 Peter Lee 认为,苹果大约花 6 个月可以赶上 Google 和微软。