data science譯為數(shù)據(jù)科學,是一門利用數(shù)據(jù)學習知識的學科,其目標是通過從數(shù)據(jù)中提取出有價值的部分來生產數(shù)據(jù)產品。
它結合了諸多領域中的理論和技術,包括應用數(shù)學、統(tǒng)計、模式識別、機器學習、數(shù)據(jù)可視化、數(shù)據(jù)倉庫以及高性能計算。數(shù)據(jù)科學通過運用各種相關的數(shù)據(jù)來幫助非專業(yè)人士理解問題。數(shù)據(jù)科學集合了計算機科學/信息技術、數(shù)學、機器學習、數(shù)學/統(tǒng)計學、軟件開發(fā)、商科以及傳統(tǒng)研究方法等等領域。是一門非常綜合且實用的學科。數(shù)據(jù)科學技術可以幫助我們正確地處理數(shù)據(jù)并協(xié)助我們在生物學、社會科學、人類學等領域進行研究調研。此外,數(shù)據(jù)科學也對商業(yè)競爭有極大的幫助。各個行業(yè)的頭部公司,如今都會組辦自己的行業(yè)研究部門和通過大數(shù)據(jù)分析消費者行為與偏好的部門,例如:Netflix、迪士尼、國內的BAT、京東小米等大廠。補充材料:
1、data science專業(yè)就業(yè)方向:Data science出來的學生未來可以成為data analyst(數(shù)據(jù)分析師)、data engineer(數(shù)據(jù)工程師)、data scientist(數(shù)據(jù)科學家)等。就拿data analyst來說,他們的工作主要是從數(shù)據(jù)庫中提取有用數(shù)據(jù),再將這些數(shù)據(jù)轉變?yōu)榭衫斫獾奈淖?,并幫助公司做出決策。此外,data science 的有關職位現(xiàn)在是供不應求。除了Google,F(xiàn)acebook這樣的信息技術公司,生物、醫(yī)療、投行等各行各業(yè)也急缺這樣的人才。每天客戶都會提供源源不斷的數(shù)據(jù),如何處理這些數(shù)據(jù)并預測公司未來的發(fā)展就變成了目前重要的議題。總的來說,如果你本科讀的是data science專業(yè),那么你未來就業(yè)就會輕松許多。
2、data science專業(yè)申請要求:(1)申請者專業(yè)背景。由于這是一個數(shù)理背景和計算機能力要求非常高的專業(yè),所以,并不是所有背景可以申請該專業(yè)。而且大部分項目會有先修課的要求,常見的先修課程有:微積分、線性代數(shù)、統(tǒng)計、計算機編程基礎(Python、R等)、計量經濟學、概率論等。首先,本科是計算機科學CS的同學,是最符合申請條件的,因為大多數(shù)數(shù)據(jù)工作都是通過編程和數(shù)據(jù)庫的相關手段進行的,同時學過統(tǒng)計、微積分、高級語言;例如哈佛大學對于MSDS的本科背景要求是:希望有微積分、線性代數(shù),概率和統(tǒng)計等相關課程,能使用至少1種編程語言,例如Python或R,了解計算機科學概念。其次,本科背景是統(tǒng)計、數(shù)學或應用數(shù)學,且有一定編程基礎的同學也可以申請,這都是很好的匹配專業(yè)。最后,商科背景出身,但量化背景較強的商科專業(yè),比如金工,但又希望能選擇一個STEM專業(yè)的同學,那DS顯然也是個非常好的選擇。所以說,如果你有比較強的編程背景,又有比較好的數(shù)理基礎,那你就很有競爭力;而純商科背景的同學,如果沒有強的量化背景,或者不懂編程,那建議還是數(shù)據(jù)科學DS和商業(yè)分析BA混合申請,因為商業(yè)分析更加偏商科,開在商學院,對商科背景接納程度大很多。此外,其他理工科或者商科也可以申請數(shù)據(jù)科學專業(yè),如:物理、生物、MIS、電子信息工程、經濟學等等。但相對來說,競爭力可能沒有計算機和數(shù)學專業(yè)的學生那么大。
(2)硬件條件。
①GPA:對于GPA當然是越高越好,對于申請TOP50的DS專業(yè)而言,GPA至少在3.3+,建議能夠到3.5+。而申請top 30的學校,建議能夠有3.8+的GPA。這樣子才會有更大的競爭力。
②TOEFL/IELTS:申請U.S News的綜合排名TOP50之前的學校的學生需要IELTS至少要達到7.0,TOEFL至少達到100。而申請TOP30之前的,IELTS至少要達到7.5,TOEFL必須達到100以上。
③GRE:美國數(shù)據(jù)科學碩士一般要求申請者提供GRE成績。綜合排名TOP50之前的學校,對于GRE 的區(qū)間在310-325,單是顯然只有310的話競爭力顯然是不夠的,因此,這里建議學生為自己設立的初步目標在320+。而申請top 30的學校,建議能夠在325+,Q部分建議能夠拿滿分。
(3)軟件要求(實習,科研,工作等等)。大部分學校的數(shù)據(jù)科學專業(yè)申請不要求工作經驗,但有相關工作經驗會對申請有幫助,建議有2-3段實習或項目經歷。實習最優(yōu)選擇應該是數(shù)據(jù)公司的數(shù)據(jù)崗,然而現(xiàn)實是這樣的崗位由于太過重要,基本不會招實習生。所以建議找一些統(tǒng)計量化相關的或者計算機相關的實習。至于科研方面,在大學期間最好找和量化相關的科研,如果實在沒有,可以把相關的課程大作業(yè)拿來用。再退而求其次,也可以是計算機軟件、數(shù)據(jù)庫相關。如果沒有科研經歷,那將是極大的硬傷。此外,可以參加一些數(shù)據(jù)科學相關的競賽。