打印本文 打印本文 关闭窗口 关闭窗口

谷歌收购API.AI 为何科技巨头争相爱上聊天机器人

作者:佚名 文章来源:网络 点击数 更新时间:2016-9-29 15:15:59 文章录入:贯通日本语 责任编辑:贯通日本语

谷歌本周收购了聊天机器人创业公司API.AI,进一步加强语音识别技术。谷歌和Facebook等公司近期的举措表明,语音将成为我们与设备互动的下一代界面。


为何谷歌要收购这样一家公司?



API.AI提供的工具能协助开发者开发类似Siri的对话式聊天机器人。


人类有着非常出色的沟通技巧。例如,如果有人说“这个女孩看到有个人拿着望远镜”,那么根据上下文语境,我们可以知道他的意思是这个女孩看到了有人用望远镜,还是携带着望远镜。


让机器人学会同样的技巧是一项复杂的挑战。许多表述都可以有不同含义,而表达同一含义又可以有多种不同说法。API.AI的目标就是解决这样的问题。该公司提供的API(应用程序接口)能进行语音识别、意图识别和语境管理,而开发者还可以向自己的聊天机器人提供某一领域的专业知识。


目前,API.AI支持15种语言,包括英语、汉语、法语、德语和西班牙语。根据该公司网站上的统计,API.AI到目前为止已处理了超过30亿次API请求。而谷歌则表示,超过6万开发者用API.AI的工具集开发了产品。


谷歌没有披露这笔收购的价格和条款。根据CrunchBase的数据,API.AI的融资总额约为860万美元。


语音时代的到来


谷歌的这笔收购,以及行业的其他发展表明,我们与应用互动的方式将从文字输入输出变为语音交流。语音的时代即将到来。



在我们双手拿着东西时,在我们运动时,在我们不想看复杂的菜单时,使用语音与手机交流将更简便。有“互联网女皇”之称的玛丽·米克尔(Mary Meeker)也认为,语音时代即将到来。她指出,语音是“计算机输入最有效的形式”。我们每分钟可以说出150个单词,而打字速度只有每分钟40个单词。通过语音,计算机可以更好地了解我们的意图,从而进行预测。我们不必每次都通过主页屏幕去导航,直接就可以获得想要的功能。


百度首席科学家吴恩达表示:“随着语音识别的准确率从95%上升至99%,我们所有人都会经常使用语音识别。”随着亚马逊Alexa开始吸引用户和开发者的关注,语音助手和语音搜索正在快速发展。


然而目前,语音界面的功能还很有限。Android系统和iOS中的Siri可以完成基本的听写,但设备大声读出所有输出信息也令人觉得不便。VoIP通话正在发展。在Facebook Messenger的10亿用户中,有3亿人每月会使用语音和视频通话功能。然而,大部分应用仍没有提供语音互动机制。


巨头的发力


Facebook于2015年收购了语音和自然语言界面创业公司Wit.ai,但到目前为止尚未公开展示如何利用该公司的技术。目前,Facebook正在测试将语音消息转换为文本,让消息接收者可以一目了然。




上周,Facebook Messenger负责人大卫·马库斯(David Marcus)表示,Facebook目前还没有积极开发语音技术,但“未来某个时候,很明显随着我们给Messenger带来越来越多功能和连接,我们将着手开发语音互动机制和界面。”


Facebook旗下WhatsApp已开始在iOS 10系统中支持Siri。用户可以用语音让WhatsApp去发消息。未来,Messenger或许也将支持这样的功能。


对Facebook而言,更远大的目标或许在于理解人类说话的不同方式。我们与他人交流以及与计算机交流之间差别很大。一年前,有消息人士表示, Facebook机密的语言技术集团正在探索这方面机会。


在与计算机互动时,我们的发音和用词都会更正式。而在与好友交流时,我们的讲话通常更随意,语速更快,充满表情。例如,你可能会说:“OK,谷歌,向我展示附近的四星评价餐厅”。而在与好友交谈时,你会说:“旁边有什么好地方去吃顿饭?”


如果Facebook希望记录、阅读及分析我们与好友交流的方式,那么或许需要开发不同的语音识别引擎。


与此同时,谷歌正准备推出一款基于语音的消息应用Allo。通过这款应用,你还可以与谷歌AI助手交谈,让它帮你预订餐厅或寻找导航路线。Allo能够很容易地判断,你想要给谁发什么样的消息。就谷歌收购API.AI而言,这将帮助该公司更好地分析用户的语音和语句结构,从而准确地了解用户意图。


如果用户频繁使用语音输入,那么Facebook和谷歌等科技巨头就可以更好地了解我们的情绪。这将帮助推动它们服务的个性化。


随着语音和AI助手API的发展,预计越来越多消息应用将会支持语音命令。开发者将开发订制的聊天机器人,在Facebook Messenger、Telegram和Slack等平台上表述你的语音,而你完全不必打开手机。


新一代蓝牙耳机将给我们带来持续开启的麦克风。苹果AirPods有着时尚的外观,这或许将推动人们长时间佩戴无线耳机。


一旦你习惯于使用人工智能助手,或是点击耳机去发消息,那么语音技术将从设备添头变为必不可少的元素。这意味着,我们不必花太多时间去盯着屏幕,而是更多地去关注周围世界。





打印本文 打印本文 关闭窗口 关闭窗口