历史性突破！微软语音识别能力已不输人类

历史性突破！微软语音识别能力已不输人类

作者：佚名文章来源：TNW中文站点击数更新时间：2016/11/26 21:30:51 文章录入：贯通日本语责任编辑：贯通日本语

智能语音识别和语音应答，成为移动互联网时代重要的技术，苹果、微软、谷歌(微博)、亚马逊等各大巨头均有布局。在人类语音识别精度上，各家厂商也展开了军备竞赛。最新消息显示，微软研发团队在识别率上，达到了堪比人类的准确度。

微软公司人工智能研发团队最近发表了一篇语音识别的论文，报告中提到他们研发的识别技术，已经实现了5.9%的词汇差错率。外媒指出，这样的差错率或者准确率，已经和正常人类基本接近。

微软公司负责语音识别研究的领导人Xuedong Huang表示：“我们已经实现了和人类一样的识别水平，这是一个历史性突破。”

据悉，各家厂商的团队，都在千方百计提高语音识别的准确率，降低词汇差错率，而在上个月，差错率的最新成绩降低到了6.3%，而微软的最新论文，又进一步实现了突破。

和其他可能被束之高阁的创新研究不同，语音识别技术能够很快应用到实际产品中，因此这一研究成果，对于微软实际业务也将产生重大意义，比如微软可以在语音助手Cortana(中文俗称“小娜”)、Xbox游戏平台、Windows操作系统中部署最新的语音识别技术。

在智能语音识别领域，微软的Cortana后来居上，行业评价已经超过了苹果的Siri，目前微软已经把语音助理覆盖了各种计算工具，比如手机、平板电脑、电脑操作系统等。

为了提高语音识别的精度，微软的研究人员采用了神经网络，来存储海量的数据，可以帮助识别软件更聪明地识别出人类语音表达的模式。

另外，微软还需要利用声音信息和图片信息，让神经网络更有效地利用存储的海量数据。

不过在研究人员看来，达到和人类持平的程度，还不是研究的最终目标，目前的识别技术还不是完美无瑕。

微软团队表示，接下来还要进一步提高语音识别的准确率。另外为了确保识别技术获得更加实际的应用，微软计划在更加嘈杂的环境中，同样实现高精度的识别，比如在一个热闹的餐馆、人潮涌动的大街上，或是在狂风暴雨环境中，微软希望在非正常环境下，语音系统也能够准确理解人们说的话。

另据报道，在智能手机时代，语音识别技术的地位比过去更重要，而目前苹果Siri表现糟糕，已经引发了苹果高管的注意。就在近日，苹果从美国卡耐基梅隆大学挖来了一个人工智能技术的教授，将负责组建微软的人工智能研究团队，这一团队的使命之一，也是大大提高Siri识别语音和智能回答问题的“智商”。