数据科学(Data Science)专业全方位介绍
2015-11-13 09:25:19 | 来源:新浪微博 | 投稿:伍迪WoodyLyu世界 | 编辑:小柯

原标题:数据科学(Data Science)专业全方位介绍

数据科学(DataScience)专业全方位介绍

摘抄于《你不知道的美国留学》_Warald着,伍迪润色。
?
什幺是数据科学
随着科技的发展,人类社会拥有的数据规模增长很快,每时每刻都有大量数据被产生和存储下来.数据量的增大和数据的多样化也促进了美国很多公司需要进行数据分析来支持商务决策.这里以大家熟悉的超市购物为例来说明数据科学的应用.
某超市发现你在过去三周一直在买某类减肥食品,预测你今后还有可能继续购买这个产品,在付账的时候,给你打印一张优惠券,买4赠1的促销,你觉得占了便宜更愿意来这家点,超市便通过打折牢牢把你捆住.这叫通过分析数据预测未来.
超市的数据科学家通过分析,发现你购买的减肥食品都具备某个特征,比如是低钠盐,低淀粉等,具有这类特点的相关食品,超市也可以推荐给你,省去你选购物品的麻烦,这叫描述性分析:分析数据找出过去事件的特征和正在发生事件的趋势.
情人节当天,超市断定避孕套的要求量很大,急匆匆跑来买避孕套的都是有刚需的人,直接涨价20%;情人节过后,避孕套价格回归正常,但是事后避孕药涨价20%.超市最大化了自己的利润,这叫规范性分析,通过分析数据找出最佳措施,取得最大优化的结果.
再就是伴随着浏览器的网页点击,亚马逊公司网站会调整产品的显示的顺序,向你推荐最感兴趣的产品,或者你修改LinkedInprofile里的skill&projects(技能&项目),这家公司将自动给你推荐匹配的工作,从你的关系网里查找可能帮忙的人,这些聪明,精准又实时的决策背后都是数据科学.
数据科学这个名次在信息技术行业更常用,很多时候在其他行业(如Target这类零售商)里称为businessanalytics(商务分析).
所以只要是基于分析大量且不规整的数据,用来支持商务决策的专业或科目都可以称为数据科学,而从事这类工作的人,不管工作职位以及名称是什幺,都可以称为数据科学家.
目前招聘数据科学家的主力主要分布在信息技术行业,保险行业,市场营销/商务智能(businessintelligence),尽管也有金融行业的公司在招聘机器学习的人,但整体上机会不多。
数据是一切分析的基础,于是很多公司也集中做一些最基本的数据收集和整理工作。他们主要用的是SQL数据可查询语言,尽管也可能写一些简单的程序,做一些粗浅的分析,但是往往工作比较枯燥无聊,也可以说是“底层人群”,用机器学习或者统计建模的则属于高级人群,分析数据要用到各种软件工具,可能需要高级的软件系统来支持做实验,自然也就需要软件工程师来支持。分析结果最终要帮助公司盈利,所以公司的管理层和直接带来盈利的部门(比如销售,营销,商业开发部门)也会参与,最终的决定权还是会在这些人手里。
?
数据科学家的三大核心技能
数据科学家需要深刻理解需求核问题所在,然后对数据进行处理,采取合理的量化分析寻求答案,所推荐的答案也必须是有数据作为支持。
1.??????独立的数据分析(datahacking)能力
要有独立地从各种各样的地方把数据化为己用的能力,可能会用到的技能有:
??SQL,用来存储和查询结构化数据.
??编程,用来处理非结构化数据,比如用Python分析和抓取数据,如果即会一门脚本语言,又会一门面向对象语言,会是优势.
??并行处理(Hadoop/Parallelprocessing),由于处理的数据量可能太大(比如超市过去半年的购物记录、信用卡公司两年内的刷卡记录),无法一次性装入内存,你需要对数据进行快速分析,这就需要MapReduce等技术。
其中,SQL和编程是最基本的,你必须会用SQL查询数据,快速编写程序分析数据。当然,变化层技术也不需要到达软件工程师的水平,因为你写的程序大多数只是一次性的,不会被复用,而且也只是被你的同事和你使用,因此对程序的质量要求不高。
要想更深入的分析问题,可能还会用到:
??探索性分析技能(exploratoryanalysisskills):一般使用Python,R,Matlab等各种工具,信息技术公司用SAS和SPSS相对较少。
??优化和仿真:有些职位需要研究顾客需求的变化,以调整产品或者服务价格,来帮助公司最大化盈利。
??机器学习和数据挖掘
??建模:
2.??????问题求解
不能单纯的按照用户的表面意思去理解,而是需要真正的理解他们需要什幺,从而转化定义出一个可以用数据解决的问题,然后选择正确的分析工具,量化分析和解决问题。
3.??????沟通能力
数据科学家需要和公司很多不同部门的人打交道,比码农更有机会见到高层或者商务领域的人。你需要区分什幺事问题本质、什幺是技术细节,要有能力给上层领导讲高级的分析和推荐,有能力给同事讲解和保护你的技术细节。也可能经常需要做报告,具备很强的可视化(visualization)技巧,如果熟悉EdwardTufte和NathanYa(这两位是美国数据可视化领域的知名人士)的东西会很有帮助。当然所有一切的解决方案,都要从为公司挣钱盈利的角度来考虑是否合理。
?
若想从事数据科学职业或者行业需要申请以下专业
计算机、信息科学、信息系统、统计、商科(尤其是市场营销)最合适。当然求职时瞄准自己专长的公司部门,做到哦有的放矢,命中率就会高。
比如学统计学专业出身的人,就不适合那些要求很强的JAVA编程能力,甚至要写被众多用户直接使用的代码的数据科学家职位了;当然计算机出身的人,如果看到要求很多统计模型,甚至要用R编程的工作或者为也需要放弃了;
其他相关专业如电子工程中做信号处理、图像处理、通信等方向的,既能编程又要用统计或者数学知识;工业工程、运筹、数学、机械工程等做做优化仿真等方向的,或者是经济学里做计量经济学的,也都有机会。
?
数据科学的专业特点和申请定位
数据科学是一个跨学科专业,学各个专业的人都可以申请。这个专业有以下特点。
1.??????面向职业培训,侧重工业界需求,没有博士学位;
2.??????作为新兴专业,很多学校没有开设专门学位,综合排名前50的学校里只有少数学校才有;
3.??????不同的项目对学生的背景要求不同,录取标准各异;
4.??????就业前景好,申请热度在升温,申请难度在增加
5.??????申请文书质量至关重要。所有学校的录取委员会都希望在文书里看到你对数据科学、商务分析有一定的理解,而不是在对这个专业所知寥寥的情况下盲目申情。同时工作经验会加分。
6.??????建议考GRE而不是GMAT.

tags:

上一篇  下一篇

相关:

我的姥姥

我生下来就没有姥姥,因为在我出生前姥姥就去世了,所以我根本就没见过我的姥姥。在我的世界里疼我的老太太

#11.13小公举资讯池#

今天又有投票抽奖活动啦!!资讯池五个交易日没当天封住涨停的了,今天给个板好吗呜呜我去次早餐

【画皮】皮肤的质感?粉底的选择?

如何提升皮肤质感和选粉底。其实吧,关于肤色我讲过了一篇很长的,关于色彩我也写过一篇很长的,关于皮肤质

有教养的孩子

其实每个人都喜欢有教养的孩子。如果一个小孩儿跟大人说话有问有答很有礼貌、能在饭桌前安安静静坐着把饭吃

帝国首富给儿子的叮咛:如果精神破产,你就会输掉一切(深度好文!)

帝国首富给儿子的叮咛:如果精神破产,你就会输掉一切(深度好文!)
本文是美国石油大王洛克菲勒写给儿子

怎么修理暴脾气男人?丨原创

文丨卢悦(新浪微博@卢悦卢悦)我们经常可以听到有的妻子抱怨丈夫脾气大,爱发火,不能忍受孩子哭闹,有时我

「今日视点」准备打官司的注意啦!打民事官司当心十七种法律风险

目前,最高人民法院《人民法院民事诉讼风险提示书》告诉您,到法院打民事官司有17种风险需当心。第一种风险

动感拍车揭秘:原来这么拍 第三季 第1集

动感拍车揭秘:原来这幺拍 第三季 第1集
这次我们精简了装备轻装上阵,所以也换了一辆小一点的车:吉普自由

近两年高分科幻大片精选照片集锦

近两年高分科幻大片精选,照片http://pan.baidu.com/s/1og3U2 密码: kdei更多最新照片请加VX:NR118114 回

今天周五大盘有回调需求,注意个股风险,是为了下周更好的上涨。

海哥还有昨天买的2成多的仓位,昨天收盘刚好5日均线上方,不过已经明显滞涨了,今天还会考验3600一线,当然

站长推荐: