AI趋势双周报第6期：Google Home利用类神经网络技术辨识用户“声”分

2017-04-28 09:23:36 | 来源：ithome | 投稿：米阳 | 编辑：dations

原标题：AI趋势双周报第6期：Google Home利用类神经网络技术辨识用户“声”分

图片来源:

Google

重点新闻(0415~0428)Google Home利用类神经网路技术辨识用户「声」分

Google近日更新Google Home APP，以让它能辨识不同用户的声音，提供个人化服务，一台Google Home最多可同时支援6名用户。Google Assistant产品经理Yury Pinsky说明，在开启Google Home程式并选择Google Home装置后，就可在装置上连结自己的帐号，之后Google Assistant即会要求用户重覆唸出Ok Google与Hey Google，透过类神经网路演算法分析，系统即可辨识使用者的声音特性，作为辨识不同用户身分的依据。

因此，未来当其中一名用户启用Google Home之后，它即可根据其身分提供相对应的个人化服务，像是音乐播放清单、通勤时间或行事曆等。其实Amazon Echo同样也能支援多名用户，只不过它必须由使用者明确要求Alexa切换至不同用户，而非如同Google Home可从声音自动辨识使用者身分。此一新的Google Home功能将率先部署于美国市场，预计数月后会延伸至英国市场。

Google云端语音辨识服务上线！连中文也能转为文字

日前，Google推出旗下云端语音辨识API（Cloud Speech API）正式版（GA），Google云端语音辨识服务能够即时辨识80种以上的语言，转换成文字，连正体中文也可以辨识。Google在2016年夏天释出云端语音辨识API公开测试版，现在终于推出正式版，提供云端开发人员使用。

而云端语音辨识API採用与Google Now、Google搜寻及Google Assistant相同的语音辨识技术，根据Google，云端语音辨识API是几款预先训练机器学习模型（Pre-Trained Machine-Learning Model）的其中之一，可以用来执行如影像分析、图像分析、文字分析和动态翻译等常见的任务。在正式版的云端语音辨识API，Google加强了长度较长的音讯档案转录精準度，以及新增支援WAV、Opus和Speex档案格式。Google也声称，新版语音辨识API比旧版的批次处理速度快3倍。

另外，目前已有厂商採用Google云端语音辨识API，根据Google官网，美国德州的电话语音SaaS开发商InteractiveTel採用Google云端语音辨识服务，透过即时的语音转文字，来分析业者与顾客在电话中的互动，以协助业者提升销售业绩。

AWS终于释出数位个人助理Alexa的后端引擎Lex

AWS近日释出了数位语音助理Alexa的后端引擎Amazon Lex，将此服务整合于AWS Lambda中，提供使用者打造自己的对话机器人，可将对话机器人部署到聊天平台、行动用户端，甚至是IoT装置，并提供管理介面，让使用者建立、部署和追蹤对话机器人的状况。

AWS表示，迄今只有极少数的开发人员打造及部署具备自动语音辨识（ARS）及自然语言理解（NLU）能力的应用程式，因为这需要大量资料与架构来进行複杂的深度演算法训练，Lex解决了这个门槛，让开发人员以支撑Alexa的ARS与NLU技术来打造能以自然语言沟通的应用程式。

Lex的应用範围比Alexa Skills Kit大上许多。Alexa Skills Kit允许开发人员利用所有的Alexa功能，但侷限于Alexa装置与生态体系；Amazon Lex主要是供企业打造客製化的聊天机器人，且它同时支援语音与文字的自然语言沟通，还可部署到各种平台上。

Lex是根据机器人所处理的文字或语音请求的数量来计费，1,000个语音请求的费用为4美元，1,000个文字请求的费用为0.75美元。它现在仍为预览版，只在美国东部的AWS区域提供。

脸书开源释出深度学习框架Caffe2，行动装置也能直接执行AI应用

脸书日前在F8大会上发布了轻量级且模组化的深度学习框架Caffe2，相较于原版Caffe框架，Caffe2更具弹性且效能更好。同时，Caffe2也是脸书推出的第一个能在正式环境中部署的版本，目前，脸书已在GitHub上释出Caffe2的开放原始码。

根据脸书表示，Caffe2框架可以部署至iOS、Android和Raspberry Pi装置，也就是说，行动装置的使用者将能直接从行动装置上取得图像辨识、自然语言处理和电脑视觉等功能，而过去这些功能得透过云端连结远端伺服器才能取得。

Caffe2不只是一个人工智慧程式框架，更是能在行动装置上执行AI的工具，允许行动装置能够直接辨识图像、影像、文字和语音。另外，Caffe2支援Python和C++ API，以及整合Visual Studio、Android Studio和XCode开发环境，提供开发者开发行动App。

开发者也可以利用模型动物园（Model Zoo）中，由开发者社群提供的预先训练模型（Pre-Trained Model）来快速打造自己的AI应用，如聊天机器人、物联网、翻译、语音辨识等应用，或是改进Model Zoo里的模型，再发布一套新的机器学习模型。

除此之外，脸书也表示，该团队与Nvidia、高通、英特尔、亚马逊和微软合作，来优化Caffe2在云端和行动装置环境的效能，且透过这样的合作，将加速机器学习社群能尝试使用更複杂的机器学习模型，并部署新一代人工智慧App和服务。

个人数位健身教练来了！为你打造专属的运动课程

美国一家新创LifeBeam近日推出一款运动耳机Vi，内建数位个人健身教练，能定位使用者的位置，提供天气的资讯，也能根据使用者的运动状态，提供量身打造的运动模式，并随时条整，全程与使用者用语音的方式交谈，就像真人教练一样。

Vi记录使用者运动的节奏、消耗的热量和慢跑的速度、距离、脚步等数据，并即时提供健身的建议，举例来说，若使用者问Vi我的状态如何？Vi会根据使用者的状况，指导使用者运动的节奏。LifeBeam设计Vi时录製了数十万的真人录音档，让Vi说话时更像真人，且藉由机器学习的技术，Vi能够不只是重複说出既定的句子，Vi甚至会问使用者有没有把名字唸错。目前，Vi可以与第三方的APP连接，包含Google Fit、Apple HealthKit和Strava等。

IBM Watson推出企业行销分析新工具

IBM近日公开了Watson一项新工具行销洞察（Watson Marketing Insights），利用人工智慧的技术，提供企业能运用现有的数据，创造出价值。Marketing Insights可以分析消费者和企业多元的销售管道的互动状况，以电子商务为例，Marketing Insights能够记录消费者未购买商品的过程，透过演算法找到消费者没有购买的动作，进而改善行销策略。

IBM表示，企业更换商品和销售策略，也会影响分析的结果，因此，Marketing Insights会自动分析最新的消费者互动状况。未来，IBM也将推出能够分析影片的工具，透过电脑视觉等技术，自动将影片分成多个场景的方式，再找到影片中重要的资讯，可以减少人工处理的时间，预计今年之前会推出。整理⊙何维涓

AI趋势近期新闻

※F8：企业版脸书Workplace新增机器人功能，整合Box与微软等企业服务

※F8: Facebook Messenger要成为通讯平台上的黄页

※蜘蛛人推出Chatbot，Marvel故事说给你听

※继Outlook和Office 365之后，Alexa也能支援G Suite行事曆

资料来源：iThome整理，2017年4月。

tags：辨识网路神经趋势利用

相关：

IAB：美国行动广告规模已占整体网络广告的一半

示意图，与新闻事件无关。图片来源: Facebook 美国互动广告局（Interactive Advertising Bureau，IAB）本周公布了美国去年的网路广告营收调查报告，指出2016年全美网路广告支出达到725亿美元，比2015年增加21%，其

内衣行业新技术新材料新趋势全解

内衣行业新技术新材料新趋势全解
这是一个实力比拼的大时代，如何捕捉变幻莫测的趋势？如何通过设计提升产品竞争力？在商品丰富、信息传播极其便利的今天，设计师正面临着前所未有的挑战。4月20日上午，由广东省纺织

脚趾发麻是啥原因？　恐因神经受伤引起

(健康医疗网／记者关嘉庆报道)不少人会趴在桌上睡午觉，一觉醒来，不是手发麻就是脚发麻，但是很快就会恢复正常；不过，却有人出现脚趾发麻的症状一直都好不了。医生提醒，脚趾发麻原因很多，最常见的是神经受伤，最

金钟奖今年首次开放网络节目参赛

新媒体时代，许多戏剧、节目只在网路平台播出，文化部影视局今天宣布2017年电视金钟奖从4月27日起受理报名，今年首次开放网路节目参赛“戏剧节目奖”及“迷你剧集奖”。文化部影视及流行音乐产业局今天公布，2017年电

姿势不良诱发自律神经失调！3招检测揪出问题

相信随着医疗知识的传播，对于“自律神经失调”多数人都有一定的认识，并将其归咎为身心症的一员！但专家提醒，其实除了压力、情绪问题外；因姿势不良引起的脊椎错位、驼背等颈椎异常问题，也是导致其发生的成因之一

热点 / Hot

站长推荐：