微软语音辨识技术再突破!辨识能力超越专业听打记录员
2017-08-22 22:51:43 | 来源:ithome | 投稿:小艾 | 编辑:dations

原标题:微软语音辨识技术再突破!辨识能力超越专业听打记录员

图片来源:

微软

继去年微软宣布,自行开发的语音辨识技术可以达到与人类相当的水准后,近日又宣布,该语音辨识技术的准确度,已经正式超越人类,并发布了详细的技术报告。

微软语音和对话研究团队在去年10月宣布,运用业界常用的电话录音测试集Switchboard,微软语音辨识技术错误率为5.9%,辨识能力可以达到人类的水准,近日则宣布,该语音辨识技术的错误率已经降至5.1%,正式超越专业的听打记录人员。

语音辨识准确度超越人类,是微软过去25年,一直想要达成的目标,微软所采用的电话对话录音测试集Switchboard,是语音研究社交采用了超过20年的测试语音辨识系统标准,开发语音辨识系统的过程,城程式需要自动记录不同人讲不同议题的对话,像是体育或是政治等。

与去年发布的正确率相比,微软用一系列的工具来改善类神经网络声学和语言模型,将此系统的错误率讲低,像是,增加了一项结合卷积式网络和双向的长短期记忆演算法的CNN-BLSTM,双向的长短期记忆演算法是一种时间递归神经网络(RNN),来改善声学模型。

此外,微软还通过声音的辨识单元Senone、Frame,以及单词,结合多个声学模型的预测,作为语音辨识的方法,并利用过去历史对话纪录,增强语音辨识的语言模型,来预测对话接下来会讲的字词,如此一来,可以模型更能够有效地判断对话的主题和内容。

这项语音辨识是依赖微软自家的深度学习框架CNTK△2.1版,并利用微软的云端计算的基础架构,特别是Azure△GPUs,大幅地提升训练模型的效率,也能快速地测试新设计的演算法。

微软表示,虽然系统辨识Switchboard的错误率已经达到只有5.1%,是一个非常大的突破,不过,未来还有许多可以继续钻研的问题,像是如何让机器像人一样,在吵杂的环境下,辨识出有腔调的语音、不同风格的说话方式和语言。

微软希望可以这项研究结果应用在微软自家的产品和服务上,像是语音个人助理Cortana和认知服务等。未来,不只让机器记录语音内容,还要能理解对话的意思和意图,从语音辨识到理解语意,是微软接下来主要发展的语音科技目标。

tags:

上一篇  下一篇

相关:

不再被微软冷落!《世纪帝国4》将在Windows 10登场

我酷新闻网记者蓝立晴/综合报道终于不再被微软(Microsoft)冷落了!22日,微软公布了经典即时战略游戏《世纪帝国4》(AgeofEmpiresIV)的宣传视频,宣布将登陆Windows10PC平台,但确切的推出日期尚未确定。距离上一

Amazon免费释出Alexa语音服务硬件开发套件

图片来源: Amazon 为了加速Alexa个人助理服务的普及,Amazon已多次向装置制造商释出技能及语音服务开发套件。Amazon周四再宣布提供Alexa语音服务装置开发套件(Voice△Service△Device△SDK),让硬件制造商更容易自

新北节电诊所开张 专业医生到府服务

【记者高金次新北报道】老是奇怪为何社区里的公共电费总是居高不下吗?夏日炎炎,用电量屡创新高,限电警报从红灯到黑灯,如何节电成为公私部门需共同面对的课题,新北市环保局“节电诊所”提供市民便捷、完善而且完

微软利用AI,让自动滑翔机像鸟一样翱翔天际

图片来源: 微软 现今,人工智慧(AI)应用在农业、制造业、医院、交通、零售业、金融等各种领域,微软研究人员则利用AI技术建立一套系统,让滑翔机能不用马达就可以保持动力。微软研究人员研发一套AI演算法,能够识别

开南大学与冲绳产学合作 专业实习起薪4万5

记者陈华兴/桃园报道为了让学生提前感受跨国工作的职场经验,强化求职竞争力。开南大学观光与餐饮旅馆学系和日本冲绳县Japan &Asia Biz Support 行政书士事务所17日签订实习合作计划,从今年下半年起,大三的学生能

站长推荐: