什么是數(shù)據(jù)科學(xué) (Data Science)

隨著科技的發(fā)展,每天每時(shí)每刻都有大量數(shù)據(jù)被產(chǎn)生和存儲(chǔ)下來(lái)。如何才能把這些數(shù)據(jù)變成有用的信息價(jià)值被人類所利用,就會(huì)通過(guò)一系列的收集、統(tǒng)計(jì)、整理、分析、挖掘等方法和技術(shù)來(lái)實(shí)現(xiàn)整個(gè)過(guò)程。數(shù)據(jù)科學(xué)是一門交叉的學(xué)科,涉及到很多的領(lǐng)域包括統(tǒng)計(jì)學(xué)、數(shù)學(xué)、計(jì)算機(jī)、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、模式識(shí)別、可視化技術(shù)等多學(xué)科的知識(shí)。大數(shù)據(jù)時(shí)代的到來(lái),為各個(gè)科學(xué)領(lǐng)域帶來(lái)了新的改革。
數(shù)據(jù)科學(xué)專業(yè)的就業(yè)前景
全球最頂尖管理咨詢公司麥肯錫 (McKinsey)出具了一份詳細(xì)的分析報(bào)告,預(yù)計(jì)到2018年,大數(shù)據(jù)或者數(shù)據(jù)工作者的崗位需求將激增,其中大數(shù)據(jù)科學(xué)家的缺口在140000到190000之間,對(duì)于懂得如何利用大數(shù)據(jù)做決策的分析師和經(jīng)理的崗位缺口則將達(dá)到1500000!
其中對(duì)大數(shù)據(jù)處理需求最旺盛的行業(yè)包括:制藥業(yè)、計(jì)算機(jī)軟件、互聯(lián)網(wǎng)、科研、 IT技術(shù)服務(wù)、生物技術(shù)。事實(shí)上,大數(shù)據(jù)工作者可以施展拳腳的領(lǐng)域非常廣泛,從國(guó)防部、互聯(lián)網(wǎng)創(chuàng)業(yè)公司到金融機(jī)構(gòu),到處需要大數(shù)據(jù)項(xiàng)目來(lái)做創(chuàng)新驅(qū)動(dòng)。數(shù)據(jù)分析或數(shù)據(jù)處理的崗位報(bào)酬也非常豐厚,在硅谷,入門級(jí)的數(shù)據(jù)科學(xué)家的收入已經(jīng)是6位數(shù)了(美元)。
數(shù)據(jù)科學(xué)的三類職業(yè)方向:機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和數(shù)據(jù)科學(xué)家
1. 機(jī)器學(xué)習(xí)工程師 Machine Learning Engineer
代表了技術(shù)含量較高的方向,工作內(nèi)容主要是開發(fā)機(jī)器學(xué)習(xí)系統(tǒng)和用這些系統(tǒng)解決實(shí)際問(wèn)題。一般需要 ship prouction coe,做出來(lái)的是數(shù)據(jù)產(chǎn)品。
2. 數(shù)據(jù)分析員 Data Analyst
工作內(nèi)容俗稱 analytics (prouct analytics or business analytics),從數(shù)據(jù)中提取insight,估計(jì)投資回報(bào)比,為產(chǎn)品方向提建議,所用工具一般較基礎(chǔ),比如寫SQL query取數(shù)據(jù)、用R/Python做簡(jiǎn)單的分析、用Tableau/Excel作圖比較常見(jiàn),能自己開發(fā)Dashboar算是analyst里面技術(shù)強(qiáng)的;工作需要產(chǎn)生各種形式的報(bào)告;在統(tǒng)計(jì)層次上,懂基本t-test和線性回歸即可。
3. 數(shù)據(jù)科學(xué)家 Data Scientist
很多人說(shuō),我想做數(shù)據(jù)科學(xué)家,我想做機(jī)器學(xué)習(xí),而這類職位就是大家想象中的那種。此類職位工作內(nèi)容以高級(jí)建模為主,會(huì)針對(duì)復(fù)雜的問(wèn)題來(lái)設(shè)計(jì)技術(shù)方案,比如 Uber叫車的ETA、各種定價(jià)系統(tǒng)、Airbnb和金融行業(yè)的Frau Detection、Amazon物流管理,F(xiàn)B/linkein的社交網(wǎng)絡(luò)或者ebay/Airbnb/Uber這樣供需雙方Marketplace市場(chǎng)規(guī)模的實(shí)驗(yàn)。這些例子,聽(tīng)上去就不是寫SQL能解決的,也不是會(huì)寫代碼就能做出來(lái)的,都需要比較深的領(lǐng)域知識(shí)。
Data science還有其他幾個(gè)類似的別稱,比如Data Mining(NJIT)、Data Analytics(Cornell University)、Preictive Analytics(DePaul University)、Business Analysis(NYU/Forham University)、Business Intelligence an Data Analytics (Carnegie Mellon University)等等。
下面我們將具體介紹 5大熱門數(shù)據(jù)科學(xué)碩士研究生項(xiàng)目:
1哥倫比亞大學(xué)
哥倫比亞大學(xué)的 MS?in?Data?Science?項(xiàng)目處于美國(guó)數(shù)據(jù)科學(xué)碩士申請(qǐng)難度的第一梯隊(duì)。該項(xiàng)目為期1年,學(xué)生共需修讀30個(gè)學(xué)分,無(wú)需撰寫畢業(yè)論文。該項(xiàng)目開設(shè)獲得專業(yè)成就認(rèn)證必需的四門基礎(chǔ)課程,學(xué)生可以在此課程基礎(chǔ)上將數(shù)據(jù)科學(xué)技術(shù)運(yùn)用于各自的興趣領(lǐng)域。
該項(xiàng)目要求申請(qǐng)者擁有一定的數(shù)學(xué)及編程基礎(chǔ),最好學(xué)過(guò)微積分、線性代數(shù)、計(jì)算機(jī)編程等課程,沒(méi)有強(qiáng)制性的工作經(jīng)驗(yàn)要求,有的話也會(huì)為申請(qǐng)者加分。需要遞交 GRE成績(jī),托福100、雅思7.0,不可使用GMAT代替GRE成績(jī)。
項(xiàng)目的學(xué)生將有機(jī)會(huì)從事包括畢業(yè)項(xiàng)目在內(nèi)的獨(dú)創(chuàng)研究,并與行業(yè)合作伙伴以及教學(xué)人員溝通互動(dòng)。畢業(yè)生可以選擇金融等服務(wù)領(lǐng)域工作,也可以選擇偏向技術(shù)的 IT企業(yè)。
2杜克大學(xué)
杜克大學(xué)的 Master?in?Interisciplinary?Data?Science?(MIDS)項(xiàng)目為期2年,該項(xiàng)目致力于培養(yǎng)一批能夠使用計(jì)算策略來(lái)激發(fā)創(chuàng)新能力和洞察力,并且善于定量思考的新型領(lǐng)導(dǎo)者。旨在培養(yǎng)學(xué)生成為能給任何領(lǐng)域做出貢獻(xiàn)的數(shù)據(jù)科學(xué)家,通過(guò)跨學(xué)科訓(xùn)練與團(tuán)隊(duì)合作科學(xué)實(shí)驗(yàn)的經(jīng)驗(yàn)促進(jìn)學(xué)生更好地利用數(shù)據(jù)的力量。項(xiàng)目規(guī)模不大,每年招收25-35名學(xué)生。
申請(qǐng)要求方面,不強(qiáng)制要求申請(qǐng)者有數(shù)學(xué)、計(jì)算機(jī)等專業(yè)背景,但是最好要學(xué)過(guò)微積分、線性代數(shù)、統(tǒng)計(jì)等數(shù)學(xué)方面的課程。需要遞交 GRE成績(jī),托福90,雅思7。畢業(yè)生去向良好,實(shí)習(xí)就業(yè)機(jī)會(huì)較多,從事的領(lǐng)域以計(jì)算機(jī)科學(xué),金融,生物科學(xué)等領(lǐng)域居多。
3賓夕法尼亞大學(xué)
賓夕法尼亞大學(xué)數(shù)據(jù)科學(xué)碩士項(xiàng)目為期一年半至兩年,將有關(guān)機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)等核心課題的前沿課程與多樣化的選修課有機(jī)結(jié)合,給予學(xué)生選擇在特定的目標(biāo)專業(yè)領(lǐng)域內(nèi)應(yīng)用技能的機(jī)會(huì)。項(xiàng)目包括基礎(chǔ)課程及數(shù)據(jù)科學(xué)應(yīng)用領(lǐng)域的實(shí)習(xí)。要求提供 GRE,無(wú)最低分?jǐn)?shù)要求。托福100,雅思7.5。畢業(yè)生就業(yè)形勢(shì)良好,就業(yè)率較高,可以進(jìn)入工程技術(shù)、咨詢、決策等領(lǐng)域。
4西北大學(xué)
西北大學(xué)分析學(xué)理學(xué)碩士項(xiàng)目( MSiA?program)由西北大學(xué)工業(yè)工程與管理科學(xué)學(xué)院開設(shè),為期15個(gè)月。該項(xiàng)目的核心課程由統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、優(yōu)化、數(shù)據(jù)庫(kù)、數(shù)據(jù)處理組成,每一門課都已之前的課程為基礎(chǔ),強(qiáng)調(diào)在商業(yè)實(shí)際中的學(xué)術(shù)研究。
申請(qǐng)要求方面,需要提供 GRE分?jǐn)?shù),要求托福95,雅思7.5。適合本科工程、商學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、信息科學(xué)技術(shù)專業(yè)背景的人士。該項(xiàng)目面向商業(yè),加上課程時(shí)間較短,有很多的實(shí)習(xí)機(jī)會(huì),大部分學(xué)生畢業(yè)后選擇直接工作,畢業(yè)生多進(jìn)入金融領(lǐng)域。
5康奈爾大學(xué)
康奈爾大學(xué)運(yùn)籌學(xué)與信息工程碩士項(xiàng)目(數(shù)據(jù)分析方向)為期 1年,共計(jì)30個(gè)學(xué)分,要求申請(qǐng)者擁有數(shù)學(xué)、工程、物理、化學(xué)、數(shù)學(xué)經(jīng)濟(jì)學(xué)等本科背景,且已經(jīng)修讀過(guò)微積分、概率論、統(tǒng)計(jì)、計(jì)算機(jī)編程、數(shù)據(jù)結(jié)構(gòu)等課程。
每年招收 50人左右,其中中國(guó)人大約30個(gè)。該項(xiàng)目選課自由度很大,并且有選CS系課程的優(yōu)先級(jí),無(wú)論你是想學(xué)CS,IS還是商科,金融,統(tǒng)計(jì),統(tǒng)統(tǒng)都可以選。這種選課的自由度放眼全美也是十分罕見(jiàn)的。
申請(qǐng)者需要托福 100(寫作不低于20,聽(tīng)力不低于15,閱讀不低于20,口語(yǔ)不低于22);雅思7;GRE數(shù)學(xué)不低于166,閱讀不低于165,寫作不低于3.5;不接受GMAT。畢業(yè)生2015年平均起薪達(dá)到83925美元,大部分學(xué)生進(jìn)入蘋果,微軟,甲骨文,F(xiàn)acebook等互聯(lián)網(wǎng)公司。
【微語(yǔ)】出國(guó)留學(xué),是人生的一次重要選擇,也許會(huì)有遺憾。不過(guò),這樣的經(jīng)歷,也正是讓你成熟起來(lái)的標(biāo)志吧!