AI趋势双周报第6期:Google Home利用类神经网络技术辨识用户“声”分
2017-04-28 09:23:36 | 来源:ithome | 投稿:米阳 | 编辑:dations

原标题:AI趋势双周报第6期:Google Home利用类神经网络技术辨识用户“声”分

图片来源:

Google

重点新闻(0415~0428)Google Home利用类神经网路技术辨识用户「声」分

Google近日更新Google Home APP,以让它能辨识不同用户的声音,提供个人化服务,一台Google Home最多可同时支援6名用户。Google Assistant产品经理Yury Pinsky说明,在开启Google Home程式并选择Google Home装置后,就可在装置上连结自己的帐号,之后Google Assistant即会要求用户重覆唸出Ok Google与Hey Google,透过类神经网路演算法分析,系统即可辨识使用者的声音特性,作为辨识不同用户身分的依据。

因此,未来当其中一名用户启用Google Home之后,它即可根据其身分提供相对应的个人化服务,像是音乐播放清单、通勤时间或行事曆等。其实Amazon Echo同样也能支援多名用户,只不过它必须由使用者明确要求Alexa切换至不同用户,而非如同Google Home可从声音自动辨识使用者身分。此一新的Google Home功能将率先部署于美国市场,预计数月后会延伸至英国市场。

Google云端语音辨识服务上线!连中文也能转为文字

日前,Google推出旗下云端语音辨识API(Cloud Speech API)正式版(GA),Google云端语音辨识服务能够即时辨识80种以上的语言,转换成文字,连正体中文也可以辨识。Google在2016年夏天释出云端语音辨识API公开测试版,现在终于推出正式版,提供云端开发人员使用。

而云端语音辨识API採用与Google Now、Google搜寻及Google Assistant相同的语音辨识技术,根据Google,云端语音辨识API是几款预先训练机器学习模型(Pre-Trained Machine-Learning Model)的其中之一,可以用来执行如影像分析、图像分析、文字分析和动态翻译等常见的任务。在正式版的云端语音辨识API,Google加强了长度较长的音讯档案转录精準度,以及新增支援WAV、Opus和Speex档案格式。Google也声称,新版语音辨识API比旧版的批次处理速度快3倍。

另外,目前已有厂商採用Google云端语音辨识API,根据Google官网,美国德州的电话语音SaaS开发商InteractiveTel採用Google云端语音辨识服务,透过即时的语音转文字,来分析业者与顾客在电话中的互动,以协助业者提升销售业绩。

AWS终于释出数位个人助理Alexa的后端引擎Lex

AWS近日释出了数位语音助理Alexa的后端引擎Amazon Lex,将此服务整合于AWS Lambda中,提供使用者打造自己的对话机器人,可将对话机器人部署到聊天平台、行动用户端,甚至是IoT装置,并提供管理介面,让使用者建立、部署和追蹤对话机器人的状况。

AWS表示,迄今只有极少数的开发人员打造及部署具备自动语音辨识(ARS)及自然语言理解(NLU)能力的应用程式,因为这需要大量资料与架构来进行複杂的深度演算法训练,Lex解决了这个门槛,让开发人员以支撑Alexa的ARS与NLU技术来打造能以自然语言沟通的应用程式。

Lex的应用範围比Alexa Skills Kit大上许多。Alexa Skills Kit允许开发人员利用所有的Alexa功能,但侷限于Alexa装置与生态体系;Amazon Lex主要是供企业打造客製化的聊天机器人,且它同时支援语音与文字的自然语言沟通,还可部署到各种平台上。

Lex是根据机器人所处理的文字或语音请求的数量来计费,1,000个语音请求的费用为4美元,1,000个文字请求的费用为0.75美元。它现在仍为预览版,只在美国东部的AWS区域提供。

脸书开源释出深度学习框架Caffe2,行动装置也能直接执行AI应用

脸书日前在F8大会上发布了轻量级且模组化的深度学习框架Caffe2,相较于原版Caffe框架,Caffe2更具弹性且效能更好。同时,Caffe2也是脸书推出的第一个能在正式环境中部署的版本,目前,脸书已在GitHub上释出Caffe2的开放原始码。

根据脸书表示,Caffe2框架可以部署至iOS、Android和Raspberry Pi装置,也就是说,行动装置的使用者将能直接从行动装置上取得图像辨识、自然语言处理和电脑视觉等功能,而过去这些功能得透过云端连结远端伺服器才能取得。

Caffe2不只是一个人工智慧程式框架,更是能在行动装置上执行AI的工具,允许行动装置能够直接辨识图像、影像、文字和语音。另外,Caffe2支援Python和C++ API,以及整合Visual Studio、Android Studio和XCode开发环境,提供开发者开发行动App。

开发者也可以利用模型动物园(Model Zoo)中,由开发者社群提供的预先训练模型(Pre-Trained Model)来快速打造自己的AI应用,如聊天机器人、物联网、翻译、语音辨识等应用,或是改进Model Zoo里的模型,再发布一套新的机器学习模型。

除此之外,脸书也表示,该团队与Nvidia、高通、英特尔、亚马逊和微软合作,来优化Caffe2在云端和行动装置环境的效能,且透过这样的合作,将加速机器学习社群能尝试使用更複杂的机器学习模型,并部署新一代人工智慧App和服务。

个人数位健身教练来了!为你打造专属的运动课程

美国一家新创LifeBeam近日推出一款运动耳机Vi,内建数位个人健身教练,能定位使用者的位置,提供天气的资讯,也能根据使用者的运动状态,提供量身打造的运动模式,并随时条整,全程与使用者用语音的方式交谈,就像真人教练一样。

Vi记录使用者运动的节奏、消耗的热量和慢跑的速度、距离、脚步等数据,并即时提供健身的建议,举例来说,若使用者问Vi我的状态如何?Vi会根据使用者的状况,指导使用者运动的节奏。LifeBeam设计Vi时录製了数十万的真人录音档,让Vi说话时更像真人,且藉由机器学习的技术,Vi能够不只是重複说出既定的句子,Vi甚至会问使用者有没有把名字唸错。目前,Vi可以与第三方的APP连接,包含Google Fit、Apple HealthKit和Strava等。

IBM Watson推出企业行销分析新工具

IBM近日公开了Watson一项新工具行销洞察(Watson Marketing Insights),利用人工智慧的技术,提供企业能运用现有的数据,创造出价值。Marketing Insights可以分析消费者和企业多元的销售管道的互动状况,以电子商务为例,Marketing Insights能够记录消费者未购买商品的过程,透过演算法找到消费者没有购买的动作,进而改善行销策略。

IBM表示,企业更换商品和销售策略,也会影响分析的结果,因此,Marketing Insights会自动分析最新的消费者互动状况。未来,IBM也将推出能够分析影片的工具,透过电脑视觉等技术,自动将影片分成多个场景的方式,再找到影片中重要的资讯,可以减少人工处理的时间,预计今年之前会推出。整理⊙何维涓

AI趋势近期新闻

※F8:企业版脸书Workplace新增机器人功能,整合Box与微软等企业服务

※F8: Facebook Messenger要成为通讯平台上的黄页

※蜘蛛人推出Chatbot,Marvel故事说给你听

※继Outlook和Office 365之后,Alexa也能支援G Suite行事曆

资料来源:iThome整理,2017年4月。

tags:辨识   网路   神经   趋势   利用

上一篇  下一篇

相关:

IAB:美国行动广告规模已占整体网络广告的一半

示意图,与新闻事件无关。 图片来源: Facebook 美国互动广告局(Interactive Advertising Bureau,IAB)本周公布了美国去年的网路广告营收调查报告,指出2016年全美网路广告支出达到725亿美元,比2015年增加21%,其

内衣行业新技术新材料新趋势全解

内衣行业新技术新材料新趋势全解
这是一个实力比拼的大时代,如何捕捉变幻莫测的趋势?如何通过设计提升产品竞争力?在商品丰富、信息传播极其便利的今天,设计师正面临着前所未有的挑战。4月20日上午,由广东省纺织

脚趾发麻是啥原因? 恐因神经受伤引起

(健康医疗网/记者关嘉庆报道)不少人会趴在桌上睡午觉,一觉醒来,不是手发麻就是脚发麻,但是很快就会恢复正常;不过,却有人出现脚趾发麻的症状一直都好不了。医生提醒,脚趾发麻原因很多,最常见的是神经受伤,最

金钟奖今年首次开放网络节目参赛

新媒体时代,许多戏剧、节目只在网路平台播出,文化部影视局今天宣布2017年电视金钟奖从4月27日起受理报名,今年首次开放网路节目参赛“戏剧节目奖”及“迷你剧集奖”。文化部影视及流行音乐产业局今天公布,2017年电

姿势不良诱发自律神经失调!3招检测揪出问题

相信随着医疗知识的传播,对于“自律神经失调”多数人都有一定的认识,并将其归咎为身心症的一员!但专家提醒,其实除了压力、情绪问题外;因姿势不良引起的脊椎错位、驼背等颈椎异常问题,也是导致其发生的成因之一

站长推荐: