如果展開講,這個問題可以寫一篇綜述了。
最近剛好有空,打算認真寫寫。僅僅在幾年前,數(shù)據(jù)科學(xué)家還不是一個正式確定的職業(yè),然而一眨眼的工夫,這個職業(yè)就已經(jīng)被譽為“今后十年IT行業(yè)最重要的人才”了。一、數(shù)據(jù)科學(xué)家的起源"數(shù)據(jù)科學(xué)"(DataScience)起初叫"datalogy "。最初在1966年由Peter Naur提出,用來代替"計算機科學(xué)"(丹麥人,2005年圖靈獎得主,丹麥的計算機學(xué)會的正式名稱就叫Danish Society of Datalogy,他是這個學(xué)會的第一任**。Algol 60是許多后來的程序設(shè)計語言,包括今天那些必不可少的軟件工程工具的原型。圖靈獎被認為是“計算科學(xué)界的諾貝爾獎”。)1996年,International Federation of Classification Societies (IFCS)國際會議召開。數(shù)據(jù)科學(xué)一詞首次出現(xiàn)在會議(Data Science, classification, and related methods)標題里。1998年,C.F. Jeff Wu做出題為“統(tǒng)計學(xué)=數(shù)據(jù)科學(xué)嗎? 的演講,建議統(tǒng)計改名數(shù)據(jù)的科學(xué)統(tǒng)計數(shù)據(jù)的科學(xué)家。 (吳教授于1987年獲得COPSS獎,2000年在 被選為中研院院士,2004年作為第一位統(tǒng)計學(xué)者當(dāng)選美國國家工程院院士,也是第一位華人統(tǒng)計學(xué)者獲此殊榮。)2002年,國際科學(xué)理事會:數(shù)據(jù)委員會科學(xué)和技術(shù)(CODATA)開始出版數(shù)據(jù)科學(xué)雜志。2003年,美國哥倫比亞大學(xué)開始發(fā)布數(shù)據(jù)科學(xué)雜志,主要內(nèi)容涵蓋統(tǒng)計方法和定量研究中的應(yīng)用。2005年,美國國家科學(xué)委員會發(fā)表了"Long-lived Digital Data Collections: Enabling Research and Education in the 21st Century",其中給出數(shù)據(jù)科學(xué)家的定義:"the information and computer scientists, database and software and programmers, disciplinary experts, curators and expert annotators, librarians, archivists, and others, who are crucial to the successful management of a digital data collection"信息科學(xué)與計算機科學(xué)家,數(shù)據(jù)庫和軟件工程師,領(lǐng)域?qū)<?,策展人和標注專家,圖書管理員,檔案員等數(shù)字數(shù)據(jù)管理收集者都以可成為數(shù)據(jù)科學(xué)家。它們主要任務(wù)是:"進行富有創(chuàng)造性的查詢和分析。"2012年,O'Reilly媒體的創(chuàng)始人 Tim O'Reilly 列出了世界上排名前7位的數(shù)據(jù)科學(xué)家。Larry Page,谷歌CEO。Jeff Hammerbacher,Cloudera的首席科學(xué)家和DJ Patil,Greylock風(fēng)險投資公司企業(yè)家。Sebastian Thrun,斯坦福大學(xué)教授和Peter Norvig,谷歌數(shù)據(jù)科學(xué)家。Elizabeth Warren,Massachusetts州美國參議院候選人。Todd Park,人類健康服務(wù)部門首席技術(shù)官。Sandy Pentland,麻省理工學(xué)院教授。Hod Lipson and Michael Schmidt,康奈爾大學(xué)計算機科學(xué)家。