台南市如何用大数据对抗登革热
2016-07-16 12:15:07 | 来源:ithome | 投稿:伊文 | 编辑:dations

原标题:台南市如何用大数据对抗登革热

成功大学资讯工程学系助理教授庄坤达表示,防疫的困难在于跨领域知识、跨部门的整合,而团队默契是台南市成功的关键。

图片来源:

iThome

去年台南爆发登革热,总共有超过4万名确诊案例,也造成214人死亡,而随着气候变迁,日渐升高的气温则利于病媒蚊滋生,因此登革热、兹卡病毒等传染疾病,也逐渐从热带、亚热带区,移动至温带区域,让公共卫生成为政府未来面临的一大挑战。

而如此严重的疫情让台南市政府措手不及,为了稳定局势,台南市政府也找上了成功大学,希望借重学界的知识,一同对抗登革热。

为此,成功大学协同数学系、资工系及医学系等学系的教授,利用政府开放资料及跨领域知识,打造「预测登革热疫情巨量资料平台」,让台南市卫生局判断何处为潜在疫情高峰区,藉以提前準备防疫宣导及扑杀病媒蚊等措施,同时,亦可告知民众即时的疫情资讯。

因此,登革热疫情从2015年9月最高峰时期、每日新增700名感染者,逐渐下降至300名,到去年11月就成功控制疫情,成功大学资讯工程学系助理教授庄坤达是此计画中建置资讯平台的关键角色。

釐清何种因素促成疫情扩散

想要让疫情获得控制,首先必须釐清,让该地成为登革热高风险区域的因素,或是影响疫情从A区转移至B区的要件。

庄坤达表示,在发布登革热确诊病例通报的时候,当局也会对患者进行调查,整理出其过去完整的活动範围区域,并且询问患者何时开始出现症状,「开始计算哪些地区的民众是高危险族群。」

例如,某学生经诊断后,确定为登革热个案,除了其住家必须进行防护之外,该生逗留时间达2小时以上的区域,也会列为高风险区,像是学校、补习班、宿舍区域。而这些资讯,也都成为系统判定该区是否为高风险区的指标。

此外,「延迟就医也会增加该地的风险係数」,庄坤达解释,绝大多数的登革热患者初期都属轻度症状,然而就医时,病情往往都已经相当严重,例如某些店家可能为了维持生意,即使工作人员出现与登革热相关的病徵,也会忍着而不就医,因此人潮众多的市场、摊贩,也变成散播疫情的温床。

透过台南市开放资料平台中的资料,使用者只要点击地图,系统就可显示出7天内500公尺以内的登革热事件。(图片来源/用数据看台湾)

撷取脸书打卡资讯,提前预警疫情热点

除了病患就医资料、开放资料外,让人想不到的是,时下脸书中热门的打卡功能,也是庄坤达评估疫情潜在热点的资讯来源。

他解释,脸书的打卡资讯之中,总共包含了两大资讯:该地区的打卡人数,以及使用者的打卡时间,因此透过打卡资讯,也能够评估该地在某时段中,是否有高密度的人流。

不同人流密度地区的打卡资讯,庄坤达也结合开放资料的病媒蚊资料、病例重镇区,使用不同深浅的颜色、热点大小的视觉画面,呈现该区是否为登革热高风险区。

不过庄坤达也表示,此作法的困难之处在于「不能过于频繁地」存取脸书的打卡资讯,而必须设计出複杂的爬虫程式,透过迂迴截取打卡资讯,避免被脸书屏蔽,而禁止连结打卡资料。

比起资料规模,他认为利用资料最难的地方在于「资料的异质性」,由于平台总共串接了水利资料、病媒蚊资料、病历资料、建筑资料等。想要混合各类资讯,转换成可用的加值应用,「背后必须凭藉各领域知识的整合。」

为了预测疫情高风险区,庄坤达也引入了机器学习中的SVM(Support Vector Machine)演算法,对登革热疫情扩散进行模拟。

他解释,假设现阶段疫情在台南某区域爆发,「可以按照过去的惯性,预测未来它可能会蔓延到何处」,以此条件为前提,大量模拟各种可能状况后,得到最有可能是高风险区的结果。

庄坤达表示:「这是一种概率分析,跟传统的预测不一样」,传统的迴归分析统计方法,若要预测某地是否为潜在疫区,只能够给出非黑即白的答案。

但是,使用SVM演算法进行模拟的结果,「并不只有0或1的答案,我认为它的结果是登革热的或然率、风险」,如果不同的模拟结果,都显示出某地可能成为未来的登革热温床,庄坤达也会加重当地的权重係数,以调高该区域的风险指数。

要让使用者有感,才是成功的资料视觉化

庄坤达的研究方向主攻资料分析、资料探勘,不过只有资讯、资料还不够,还要凭藉资料视觉化,使用者才能快速的从中撷取有用的资讯,庄坤达更认为:「资料视觉化是未来趋势,一种互动式的网站呈现技术」。

他进一步表示,要发挥此类地图资讯系统(GIS)的威力,最重要同时也最困难的是「让使用者马上看到自己所需要的资讯。」

他解释,大部分民众不太想要在系统中看见太多的统计数据,因此,一个系统即使拥有相当丰富的资讯,使用者也不会有太大的共鸣。因此,他认为,视觉化最重要的关键是:「让使用者愿意使用,并且方便其进行决策。」

但是,要如何让使用者对登革热资讯平台有感呢?庄坤达笑说:「让使用者知道自己是不是位在疫情的热区就好」,因为民众往往对于贴近生活周遭的事物感受最强。

同时,开放资料结合网页开发技术,更可加强资料视觉化的威力。庄坤达表示,系统藉由网站形式呈现,使用者可以即时提出新增功能的需求,开发者也能针对相关回馈,马上修改系统。

例如,他把网页连结提供给台南市卫生局局长时,局长在试用过后,也立即回馈相关意见。若当时不是使用网页呈现,而是改採开发单机版本的系统,庄坤达就无法如此迅速与使用者互动。

面对不同专长的成员,庄坤达表示:「做资料科学的人,要勇敢发问」,虽然他一开始并不熟悉传染病的知识,但是身为具备资工背景的人,有时也能提出与他人不同的观点、见解。

例如,过去团队成员曾经感到相当困扰,究竟要透过何种方式,才能掌握人流移动、人口活跃活动的区域,而庄坤达直接联想到,可以使用脸书的打卡资讯,来掌握部分的人流讯息。

信心、由上而下的推力,都是打赢防疫战的关键

「防疫最重要的是信心」,庄坤达表示,一开始台南市并没有抓到防疫作战的节奏,而登革热又在去年9月时达到最高峰期,疾病的扩散率也一直往上飙升。

但是,藉由台南市政府与成功大学的合作,「就像提供了市政一对眼睛」,协助卫生局锁定最多疫情区域,直接规画防疫计画,因此登革热扩散率也渐渐降低,在去年11月就完全消除了疫情。

在最高峰时,台南市每日总共会新增多达700名病患,但是随着防疫计画的进行,每天新增病患数也下降到300、400人,数字也直接反映了平台的效果。

庄坤达表示,传染病趋势,往往会跟随常态分配的模式,一旦度过最高峰后,疫情就会渐进趋缓。

然而,其他县市是否能够複製台南市的成功经验呢?庄坤达表示,防疫的难度在于跨领域知识、跨部门的整合,「团队默契是成功的关键」。

同时,他也表示,由上而下的推力相当重要,台南市市长赖清德、成功大学校长苏慧贞,都具备公共卫生的学位背景,对于登革热防治相当重视,皆要求各单位尽力配合。因此,「一旦具备了天时、地利、人和」,台南市才可在这场防疫大战中获得胜利。

tags:台南市   登革热   对抗   数据

上一篇  下一篇

相关:

上半年经济数据公布 [GG热榜]

国家统计局今日上午公布今年上半年国民经济运行情况。初步核算,上半年国内生产总值340637亿元,按可比价格计算,同比增长67%。分季度看,一季度国家统计局今日将公布今年上半年国内生产总值(GDP)、投资、消费、居民

Google示範如何用云端大数据,96年飞弹危机后,外媒对台湾关注度年年下滑

科技人在利用开放资料找出价值的过程中,最需要具备的特质就是好奇心,Google USA软体工程师Felipe Hoffa指出。而他举出的开放资料应用实例,就是分析纽约市计程车的搭乘时间与车资支付方式。他说,首先利用纽约市政

挑战马拉松必知!专业跑者这样对抗疲劳

近年来,许多大型马拉松、路跑赛事于台湾举办。台北马拉松、大鲁阁路跑、colorrun、夜光路跑等,结合旅游、旅游、时尚流行的路跑主题,让“路跑”跨出竞技范畴,人人均可参与,成为生活、休闲的重要话题。但无论是10

牢记安心3步骤 有效检测登革热

(优活健康网记者徐平/ 综合报道)伴随全球暖化,气温持续攀升,病媒蚊分布区域扩大,国外旅游盛行,登革病毒传播迅速,台湾去年发生登革热疫情,病患感染登革热初期,使用“登革热快速诊断试剂”(简称登革热快筛)作为

怕得登革热 台南人一感冒就想快筛

(中央社记者张茗喧台北13日电)去年台南登革热大流行,吓坏台南人,医生今表示,近来很多台南民众一有感冒症状就直冲医院问“是不是登革热”要求快筛,他提醒,如医生认为不用,但民众仍想筛,就得自费。卫福部食药

站长推荐: