智能语音识别和语音应答,成为移动互联网时代重要的技术,苹果、微软、谷歌(微博)、亚马逊等各大巨头均有布局。在人类语音识别精度上,各家厂商也展开了军备竞赛。最新消息显示,微软研发团队在识别率上,达到了堪比人类的准确度。
微软公司人工智能研发团队最近发表了一篇语音识别的论文,报告中提到他们研发的识别技术,已经实现了5.9%的词汇差错率。外媒指出,这样的差错率或者准确率,已经和正常人类基本接近。
微软公司负责语音识别研究的领导人Xuedong Huang表示:“我们已经实现了和人类一样的识别水平,这是一个历史性突破。”
据悉,各家厂商的团队,都在千方百计提高语音识别的准确率,降低词汇差错率,而在上个月,差错率的最新成绩降低到了6.3%,而微软的最新论文,又进一步实现了突破。
和其他可能被束之高阁的创新研究不同,语音识别技术能够很快应用到实际产品中,因此这一研究成果,对于微软实际业务也将产生重大意义,比如微软可以在语音助手Cortana(中文俗称“小娜”)、Xbox游戏平台、Windows操作系统中部署最新的语音识别技术。
在智能语音识别领域,微软的Cortana后来居上,行业评价已经超过了苹果的Siri,目前微软已经把语音助理覆盖了各种计算工具,比如手机、平板电脑、电脑操作系统等。
为了提高语音识别的精度,微软的研究人员采用了神经网络,来存储海量的数据,可以帮助识别软件更聪明地识别出人类语音表达的模式。
另外,微软还需要利用声音信息和图片信息,让神经网络更有效地利用存储的海量数据。
不过在研究人员看来,达到和人类持平的程度,还不是研究的最终目标,目前的识别技术还不是完美无瑕。
微软团队表示,接下来还要进一步提高语音识别的准确率。另外为了确保识别技术获得更加实际的应用,微软计划在更加嘈杂的环境中,同样实现高精度的识别,比如在一个热闹的餐馆、人潮涌动的大街上,或是在狂风暴雨环境中,微软希望在非正常环境下,语音系统也能够准确理解人们说的话。
另据报道,在智能手机时代,语音识别技术的地位比过去更重要,而目前苹果Siri表现糟糕,已经引发了苹果高管的注意。就在近日,苹果从美国卡耐基梅隆大学挖来了一个人工智能技术的教授,将负责组建微软的人工智能研究团队,这一团队的使命之一,也是大大提高Siri识别语音和智能回答问题的“智商”。