“統(tǒng)計(jì)”一詞,英語(yǔ)為statistics,用作復(fù)數(shù)名詞時(shí),意思是統(tǒng)計(jì)資料,作單數(shù)名詞時(shí),指的是統(tǒng)計(jì)學(xué)。
一般來(lái)說(shuō),統(tǒng)計(jì)這個(gè)詞包括三個(gè)含義:統(tǒng)計(jì)工作、統(tǒng)計(jì)資料和統(tǒng)計(jì)學(xué)。這三者之間存在著密切的聯(lián)系,統(tǒng)計(jì)資料是統(tǒng)計(jì)工作的成果,統(tǒng)計(jì)學(xué)來(lái)源于統(tǒng)計(jì)工作。原始的統(tǒng)計(jì)工作即人們收集數(shù)據(jù)的原始形態(tài)已經(jīng)有幾千年的歷史,而它作為一門(mén)科學(xué),還是從17世紀(jì)開(kāi)始的。英語(yǔ)中統(tǒng)計(jì)學(xué)家和統(tǒng)計(jì)員是同一個(gè)(statistician),但統(tǒng)計(jì)學(xué)并不是直接產(chǎn)生于統(tǒng)計(jì)工作的經(jīng)驗(yàn)總結(jié)。每一門(mén)科學(xué)都有其建立、發(fā)展和客觀條件,統(tǒng)計(jì)科學(xué)則是統(tǒng)計(jì)工作經(jīng)驗(yàn)、社會(huì)經(jīng)濟(jì)理論、計(jì)量經(jīng)濟(jì)方法融合、提煉、發(fā)展而來(lái)的一種邊緣性學(xué)科。
1,關(guān)于單詞statistics起源于國(guó)情調(diào)查,最早意為國(guó)情學(xué)。十 七世紀(jì),在英格蘭人們對(duì)“政治算術(shù)”感興趣。
1662年,John Graunt發(fā)表了他第一本也是唯一一本手稿,《natural and politics observations upon the bills of mortality》, 分析了生男孩和女孩的比例,發(fā)展了現(xiàn)在保險(xiǎn)公司所用的那種類(lèi)型的死亡率表。英文的statistics大約在十八世紀(jì)中葉由德國(guó)學(xué)者 Gottfried Achenwall所創(chuàng)造,是由狀態(tài)status和德文的政治算術(shù)聯(lián)合推導(dǎo)得出的,第一次由John Sinclair所使用,即1797年出現(xiàn)在Encyclopaedia Britannica。(早期還有一個(gè)單詞publicitics和statistics競(jìng)爭(zhēng)“統(tǒng)計(jì)”這一含義,如果得勝,現(xiàn)在就開(kāi)始流行 publicitical learning了)。
2,關(guān)于高斯分布或正態(tài)分布1733年,德-莫佛(De Moivre)在給友人分發(fā)的一篇文章中給出了正態(tài)曲線(這一歷史開(kāi)始被人們忽略)1783年,拉普拉斯建議正態(tài)曲線方程適合于表示誤差分布的概率。
1809年,高斯發(fā)表了他的關(guān)于天體運(yùn)行論的偉大著作,在這一著作的第二卷第三節(jié)中,他導(dǎo)出正態(tài)曲線適宜于表示誤差規(guī)律,同時(shí)承認(rèn)拉普拉斯較早的推導(dǎo)。正態(tài)分布在十九世紀(jì)前葉因高斯的工作而加以推廣,所以通常稱(chēng)作高斯分布???皮爾遜指出德-莫佛是正態(tài)曲線的創(chuàng)始人,第一個(gè)稱(chēng)它為正態(tài)分布,但人們?nèi)粤?xí)慣稱(chēng)之高斯分布。
3,關(guān)于最小二乘法1805年,Legendre提出最小二乘法,Gauss聲稱(chēng)自己在1794年用過(guò),并在1809年基于誤差的高斯分布假設(shè),給出了嚴(yán)格推導(dǎo)。
4,其它在十九世紀(jì)中葉,三個(gè)不同領(lǐng)域產(chǎn)生的重要發(fā)展都是基于隨機(jī)性是自然界固有的這個(gè)前提上的。阿道夫·凱特萊特(A. Quetlet,1869)利用概率性的概念來(lái)描述社會(huì)學(xué)和生物學(xué)現(xiàn)象(正態(tài)曲線從觀察誤差推廣到各種數(shù)據(jù))孟德?tīng)枺℅.Mendel,1870)通過(guò)簡(jiǎn)單的隨機(jī)性結(jié)構(gòu)公式化了他的遺傳法則玻爾茲曼(Boltzmann,1866)對(duì)理論物理中最重要的基本命題之一的熱力學(xué)第二定律給出了一個(gè)統(tǒng)計(jì)學(xué)的解釋。
1859 年,達(dá)爾文發(fā)表了《物種起源》,達(dá)爾文的工作對(duì)他的表兄弟高爾登爵士有深遠(yuǎn)影響,高爾登比達(dá)爾文更有數(shù)學(xué)素養(yǎng),他開(kāi)始利用概率工具分析生物現(xiàn)象,對(duì)生物計(jì) 量學(xué)的基礎(chǔ)做出了重要貢獻(xiàn)(可以稱(chēng)他為生物信息學(xué)之父吧),高爾登爵士是第一個(gè)使用相關(guān)和回歸這兩個(gè)重要概念的人,他還是中位數(shù)和百分位數(shù)這種概念的創(chuàng)始 人。受高爾登工作影響,在倫敦的大學(xué)學(xué)院工作的卡爾-皮爾遜開(kāi)始把數(shù)學(xué)和概率論應(yīng)用于達(dá)爾文進(jìn)化論,從而開(kāi)創(chuàng)了現(xiàn)代統(tǒng)計(jì)時(shí)代,贏得了統(tǒng)計(jì)之父的稱(chēng)號(hào),1901年Biometrika第一期出版(卡-皮爾遜是創(chuàng)始人之一)。
5,關(guān)于總體和樣本在早期文獻(xiàn)中可找到由某個(gè)總體中抽樣的明確例子,然而從總體中只能取得樣本的認(rèn)識(shí)常常是缺乏的。 ----K.皮爾遜時(shí)代到十九世紀(jì)末,對(duì)樣本和總體的區(qū)別已普遍知道,然而這種區(qū)分并不一定總被堅(jiān)持。----1910年Yule在自己的教科書(shū)中指出。在 1900年代的早期,區(qū)分變的更清楚,并在1922年被Fisher特別強(qiáng)調(diào)。----Fisher在1922年發(fā)表的一篇重要論文中《On the mathematical foundation of theoretical statistics》,說(shuō)明了總體和樣本的聯(lián)系和區(qū)別,以及其他概念,奠定了“理論統(tǒng)計(jì)學(xué)”的基礎(chǔ)。
6,期望、標(biāo)準(zhǔn)差和方差期望是一個(gè)比概率更原始的概念,在十七世紀(jì)帕斯卡和費(fèi)馬時(shí)代,期望概念已被公認(rèn)了。K.皮爾遜最早定義了標(biāo)準(zhǔn)差的概念。
1918年,F(xiàn)isher引入方差的概念。力學(xué)中的矩和統(tǒng)計(jì)學(xué)中的中數(shù)兩者之間的相似性已被概率領(lǐng)域的早期工作者注意到,而K.皮爾遜在1893年第一次在統(tǒng)計(jì)意義下使用“矩”。
7,卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量,是卡-皮爾遜提出用于檢驗(yàn)已知數(shù)據(jù)是否來(lái)自某一特定的隨機(jī)模型,或已知數(shù)據(jù)是否與已給定的假設(shè)一致。卡方檢驗(yàn)被譽(yù)為自1900年以來(lái)在科學(xué)技術(shù)所有分支中20個(gè)尖端發(fā)明之一,甚至敵人Fisher都對(duì)此有極高評(píng)價(jià)。
8,矩估計(jì)與最大似然卡-皮爾遜提出了使用矩來(lái)估計(jì)參數(shù)的方法。Fisher則在1912年到1922年間提出了最大似然估計(jì)方法,基于直覺(jué),提出了估計(jì)的一致性、有效性和充分性的概念。
9,概率的公理化1933年,前蘇聯(lián)數(shù)學(xué)家柯?tīng)柲衤宸颍↘olmogorov)發(fā)表了《概率論的基本概念》,奠定了概率論的嚴(yán)格數(shù)學(xué)基礎(chǔ)。
10,貝葉斯定理貝葉斯對(duì)統(tǒng)計(jì)學(xué)幾乎沒(méi)有什么貢獻(xiàn),然而貝葉斯的一篇文章成為貝葉斯學(xué)派統(tǒng)計(jì)學(xué)的思想模式的焦點(diǎn),這一篇文章發(fā)表于1763年,由貝葉斯的朋友、著名人壽保險(xiǎn)原理的開(kāi)拓者Richard Price在貝葉斯死后提出來(lái)的----貝葉斯定理。概 率思想的兩種方法,(1)作為一個(gè)物理系統(tǒng)內(nèi)在的一種物理特性,(2)對(duì)某一陳述相信程度的度量。 在1950年代后期止,多數(shù)統(tǒng)計(jì)學(xué)家采取第一種觀點(diǎn),即概率的相對(duì)頻數(shù)解釋?zhuān)@一時(shí)期貝葉斯定理僅應(yīng)用在概率能在頻數(shù)框架內(nèi)解釋的場(chǎng)合。貝葉斯統(tǒng)計(jì)學(xué)派著 作的一個(gè)浪潮始于1960年。自此,贊成和反對(duì)貝葉斯學(xué)派統(tǒng)計(jì)的兩方以皮爾遜和費(fèi)舍爾所特有的激情和狂怒進(jìn)行申辯和爭(zhēng)辯。 在1960年以前,幾乎所有的統(tǒng)計(jì)書(shū)刊都避免使用貝葉斯學(xué)派方法,F(xiàn)isher堅(jiān)持避免使用貝葉斯定理,并在他的最后一本書(shū)中再一次堅(jiān)決的拒絕了它???皮爾遜偶然使用,總的來(lái)說(shuō)是避免的。奈曼和E.S.皮爾遜在他們有關(guān)假設(shè)檢驗(yàn)的文章中堅(jiān)決反對(duì)使用。