Google DeepMind AI技术新突破 打造唇语解读系统
2016-11-26 00:03:18 | 来源:ectimes | 投稿:小柯 | 编辑:dations

原标题:Google DeepMind AI技术新突破 打造唇语解读系统

记者/谢驭婷

Google旗下人工智慧部门DeepMind与牛津大学研究员在机器学习(Machine Learning)技术上又有新突破,特别设计让电脑可以自动“学习”的机器学习演算法,让电脑从大量资料中自动分析获得规律,利用规律对未知数据进行预测的算法,借此打造出能解读唇语功能的AI系统,它能透过无声影像辨识唇语,研究结果显示,解读正确率更胜专家。

?DeepMind唇语解读AI系统能够透过无声影像,辨识解读句子。(截图自/YouTube影音)

从2010年开始,研究人员并以大量的资料来训练AI唇语解读系统,使用BBC2010到2015年间总长超过5000小时的电视节目,共包含11.8万个句子,用来训练AI系统观看、收听、注意及拼音的功能。训练完毕后,研究人员找来人类唇语专家与AI唇语解读系统进行比对测试,解读来自电视节目中随机选取的200支视频,研究结果显示,人类唇语专家解读正确率仅为12.4%,而AI唇语解读系统正确率却高达46.8%,远胜人类专家。

此项新技术与其他近期热门语音辨识软件相比,AI唇语解读在吵杂的环境中更具优势,如视讯通话时环境音太吵或对方有听觉障碍时,只需看手机荧幕,便能知道对方说话的內容。另外研究人员也解释,此系统与其他唇读系统不同之处在于,它能够解释句型结构较为复杂的语句和野外视频。相较以前的系统,如牛津大学的LipNet,只针对识别有限数量的词语和短句。

DeepMind的研究人员表示此系统未来有许多应用之处,如改善助听器,帮助听觉受损者,或者提高语音识别的准确性和静音听写,也可用来注释无声电影,或允许使用者在控制像是Siri这种数位助理时,也只需对着手机镜头动动你的嘴巴,便能传递指令,达到交谈效果。

tags:解读   打造   系统   技术

上一篇  下一篇

相关:

丹比奴DAMBOLO冬季女鞋,轻松打造大长腿

丹比奴DAMBOLO冬季女鞋,轻松打造大长腿
有时候不得不承认身高就是一个硬伤,每次去超市买东西,高层货架的东西总是拿不到,想看一眼都那么困难,更别说买了;每次拉上朋友去看演唱会,就只能看人头,连自己喜

丰田开发电池技术 提升电动车续航里程

丰田汽车开发出侦测电动车所使用鋰电池內微小粒子行动的技术,这项技术进展有助提升电池性能以及把电动车续航里程提高10%到15%。改良后电动车预计未来几年內上市。“美国新闻与世界报道”引述美联社报道,丰田工程师

超级电容技术再升级 秒速充电不是梦

记者/陈彣林智慧型手机在使用18个月以上,电池的续航力会愈来愈差,也会变得不易充电。中央佛罗里达大学(UCF)的研究团队研发了一款电容器原型,能够在数秒钟內,充饱可供一周使用的电量,且不同于一般电池具有记忆

工研院串联20台厂 打造巨量微组装联盟

工研院串联20多家显示、LED、半导体及系统整合厂商, 共组巨量微组装产业推动联盟,建构台湾微组装产业生态。工研院副院长刘军廷表示,全世界各产业都朝向“跨业平台”快速发展,整合各种功能在一个微小系统,以提供

DeepMind与牛津大学打造唇语AI系统,准确率更胜专家

研究人员以大量的BBC节目影片作为唇语AI系统的学习材料。 Alphabet旗下的人工智慧子公司DeepMind与牛津大学(University of Oxford)工程科学系的科学家们上周发表了一篇以人工智慧型(AI)协助辨识唇语的研究报告

站长推荐: