微软亚洲研究院院长洪小文:AI应用可先从重复性高的工作切入,要像人脑运作还有很大落差
2017-05-26 23:18:55 | 来源:ithome | 投稿:梁子 | 编辑:dations

原标题:微软亚洲研究院院长洪小文:AI应用可先从重复性高的工作切入,要像人脑运作还有很大落差

图片来源:

何维涓_摄影

亚洲微软研究院于今日举办Academic Day 2017,聚焦于AI结合多项技术发展的新应用,多位微软研究员都一同出席,发表了多项最新的研究。其中,微软亚洲研究院首席研究员Katsu Ikeuchi专精于电脑视觉与人工智慧,这次更是在演讲中展示,机器人能够纪录并模仿台湾原住民舞蹈,中央研究院资讯科学研究所研究员Mark Liao则是展示将观众录下的片段演唱会影片,重新分析影像和音质,创造出不重複且高品质的完整演唱会影音,科技部政务次长林一平发表在台中、新竹和台南科学园区试行的Smart Science Park专案,能够透过多项IoT装置,利用电脑视觉和人工智慧技术,提供更便利的服务给使用者。此外,还有由微软实行生所创作的10项多元创新应用Demo。

「AI与人刚好互补,」微软亚洲研究院院长洪小文表示,AI硬记的能力很强,刚好是人类比较弱的地方,而人类拥有感知能力、创造力和意识,正是AI没有的能力,他认为有许多问题是需要AI加上HI(Human Intelligence)协同合作,而目前AI最擅长的则是处理重複性高的工作,且必须在没有外来因素影响的封闭式环境下,若是不常遇到的问题,由于收集的数据不足,无法训练模型,且投入成本过高也不适合採用。

不过他也坦言,AI目前的技术离人脑的运作模式还有一大段落差,他认为,由于大家对人脑的运作了解还太少,且人类脑部许多複杂的运作是无从解释的,AI要达到模仿人脑短期之内是不太可能。

Katsushi Ikeuchi利用拉班舞谱(Labanotation)的原理分析人类肢体动作,将人的动作分为8个方向,再透过机器学习演算法,让机器人用电脑视觉的技术记录下拆解过的动作资讯,再转化为生成动作的程式,让机器人可以模仿舞蹈动作,Katsushi Ikeuchi展示了机器人跳民俗舞蹈和台弯原住民舞蹈的影片,他认为可将机器人跳舞的研究套用在许多领域中,像是居家陪伴或是医疗照护等,甚至可以打造服务型的机器人。

Katsushi Ikeuchi也看见台湾发展新科技的机会,他认为,虽然台湾市场规模虽然较小,但是却有可以快速转变的优势,因此,若要在台湾尝试发展新技术是非常有潜力的。

另外一项AI创新的研究则是Mark Liao发表的演唱会影片重组,他将观众参加演唱会后录製的片段影片,拼成一个完整高品质的影片,由于拍摄的时间、取景、设备不同,他则要面临影片品质的统一、影片片段不重複等问题,要如何选影片更是一大学问,光是要选影片音质好的片段,还是画质好的也是个问题,他将每段影片利用六大镜头拍摄方式分类,再经过深度学习演算法挑选出最适合的片段,最后再将片段的影片,拼成一个拥有完整内容,且不重複的影片。

微软实行生所创作的10项多元创新应用Demo中,有项AI应用是让系统可以看图作诗,这项研究是由台湾大学徐宏民教授、林守德教授和亚洲研究员宋睿华一同指导,台湾大学资工研究所一年级研究生吴肇中与网路多媒体研究所毕业生郑文峰去年在微软实习时,一开始发想是要用程式创造小说,后来因为複杂度较高,且要维持故事情节一致性较为困难,转而让程式自动写新诗,并加入图片的想法,让系统输入一张图片时,可以自动产生与图片主题相关的新诗。

他们收集了519为诗人的作品,高达9万行的诗句作为资料集,先用电脑视觉技术将图片撷取出多个物件,找出相对应的关键字,再利用以诗句常出现的关键词集滤器出诗句常见的词彙,以这些词彙做延伸,创造出4句的新诗,系统自动产生出来的诗,首先由他们内部人工判断句子的流畅度,等系统较稳定后,再请专业的诗人评分,这项研究得到微软小冰专案经理注视,在小冰的服务中限时开放6小时让使用者使用,得到广大迴响。

另外,他们还将系统做的诗投稿多项比赛,最终获得北京晨报、信报和长江诗歌三大媒体刊登,他们也化名在各大文学论坛发表新诗,大多的人都反应写的很好,难以察觉是机器所写。

另一个有趣的应用是Seeing Bot,透过镜头的影像,可以即时显示画面的描述文字,像是一个人正在滑雪。开发团队收集一百万支影片,透过机器学习,能分析大约400多个动作,即时地自动产生对影片的描述。不过,目前还不能辨识性别。

tags:人脑   微软   亚洲   落差   要像

上一篇  下一篇

相关:

微软将Beam改名Mixer,改版新增4分割画面、App

图片来源: Mixer 去年微软买下的游戏直播平台业者Beam并整合到Windows及Xbox One中,本周宣布改版并改名为Mixer,新增4人分割画面及iOS、Android版本app等新功能。?Beam创办人Matt Salsamendi说明,改为Mixer是因为它

微软改采Git控制Windows开发,打造全球最大Git储存库

微软开源GVFS。 图片来源: GitHub 微软技术院士暨企业副总裁Brian Harry于本周三(5/24)指出,这3个月以来,微软视窗团队几乎已完成Git及Git虚拟档案系统(Git Virtual File System,GVFS)的部署,创造了全球最大

微软着手研究体积更小、更轻便的AR眼镜

微软研究中的AR眼镜外型更像一般眼镜,能提供80度的视野影像。 图片来源: Microsoft 微软在扩增实境(Augmented Reality, AR)上力推HoloLens,不过微软可能正在研发一个体积更小,更像眼镜的AR装置。?微软研究院上

AI双周报第8期:微软Bot Framework大更新,LUIS语意理解服务开始支援多人开发模式

图片来源: 微软 重点新闻(0513~0526)微软Bot Framework大更新,LUIS语意理解服务开始支援多人开发模式微软近日在2017年Build大会上更新Bot Framework功能,不但新增了3个能部署Chatbot的对话通道,还提供开发人员打造

传微软拟以1亿美元买下资安新创Hexadite,强化资安战力

示意图,与新闻事件无关。 图片来源: Microsoft 以色列媒体Calcalist报导,软体业巨头微软(Microsoft)打算以1亿美元(约合新台币30亿元)併购资安管理与自动化业者Hexadite,不过双方都不愿就相关报导做出回应。?总部

站长推荐: