數(shù)理統(tǒng)計(jì)探討論文
時(shí)間:2022-02-11 04:21:00
導(dǎo)語:數(shù)理統(tǒng)計(jì)探討論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
許寶騄(1910—1970年)是20世紀(jì)中最富有創(chuàng)造性的統(tǒng)計(jì)學(xué)家之一,是中國最早在概率論與數(shù)理統(tǒng)計(jì)研究方向達(dá)到世界先進(jìn)水平的杰出數(shù)學(xué)家。他加強(qiáng)了強(qiáng)大數(shù)定律;研究了中心極限定理中誤差大小的精確估計(jì);發(fā)展了矩陣變換技巧;得到了高斯2馬爾科夫(Gauss-Markov)模型中方差的最優(yōu)估計(jì);揭示了線性假設(shè)似然比檢驗(yàn)的第一個(gè)優(yōu)良性質(zhì)等[1]。其研究成果已經(jīng)成為當(dāng)代概率論與數(shù)理統(tǒng)計(jì)理論的重要組成部分,至今“許方法”仍被認(rèn)為是解決檢驗(yàn)問題的最實(shí)用方法。
少年時(shí)代的許寶騄受益于表姐夫徐傳元(畢業(yè)于美國麻省理工學(xué)院)的指導(dǎo)。1928年,許寶騄考入燕京大學(xué)化學(xué)系,但對數(shù)學(xué)的濃厚興趣,促使他改攻數(shù)學(xué),并于1930年考入清華大學(xué)數(shù)學(xué)系。期間,深受熊慶來(1893—1969年)、孫光遠(yuǎn)(1900—1979年)和楊武之(1896—1973年)的教誨。1933年,以優(yōu)異成績獲得理學(xué)士學(xué)位。1936年,通過赴英庚子賠款公費(fèi)留學(xué)考試,進(jìn)入倫敦大學(xué)學(xué)院(UniversityCollege)的高爾頓(FrancisGaldon,1822—1911)實(shí)驗(yàn)室和統(tǒng)計(jì)系學(xué)習(xí)數(shù)理統(tǒng)計(jì)學(xué)。1938年獲得哲學(xué)博士學(xué)位,兩年后又獲得理學(xué)博士學(xué)位[2]。
1940年,許寶騄回到抗日烽火中的祖國,受聘為北京大學(xué)教授,在西南聯(lián)合大學(xué)任教。1945年,應(yīng)加州伯克利大學(xué)和哥倫比亞大學(xué)的聯(lián)合邀請而前往美國。1947年10月,謝絕眾多朋友的挽留,毅然回到中國,此后一直在北京大學(xué)任教。
許寶騄是中央研究院第一屆當(dāng)選的5名數(shù)學(xué)所院士之一。1955年當(dāng)選為中國科學(xué)院學(xué)部委員。1979年美國《數(shù)理統(tǒng)計(jì)學(xué)年鑒》高度評價(jià)了他對概率論與數(shù)理統(tǒng)計(jì)學(xué)科所做出的卓越貢獻(xiàn)。1981年和1983年,科學(xué)出版社和德國施普林格(Springer2Verlag)出版社分別出版了《許寶騄文集》和《許寶騄選集》。在美國斯坦福大學(xué)統(tǒng)計(jì)系走廊里至今懸掛著許寶騄的畫像。
1984年,為了紀(jì)念許寶騄及推進(jìn)我國統(tǒng)計(jì)學(xué)的發(fā)展,數(shù)學(xué)家鐘開萊、鄭清水、徐利治發(fā)起設(shè)立“許寶騄統(tǒng)計(jì)數(shù)學(xué)獎(jiǎng)”,獎(jiǎng)勵(lì)35歲以下研究數(shù)理統(tǒng)計(jì)與理論統(tǒng)計(jì)的青年工作者。這是我國最高的數(shù)學(xué)獎(jiǎng)項(xiàng)之一。
1問津概率論王國
1880年,英國學(xué)者傅蘭雅(JohnFryer,1839—1928)和中國數(shù)學(xué)家華蘅芳(1833—1902年)合譯的《決疑數(shù)學(xué)》是傳入我國的第一部概率論著作。由于種種因素,該書對我國的概率論發(fā)展沒有產(chǎn)生多大影響。辛亥革命后,微積分、近世代數(shù)、近世幾何學(xué)等相繼進(jìn)入我國的高等教育領(lǐng)域,而概率論尚未進(jìn)入。1915年1月創(chuàng)刊的中國第一份現(xiàn)代科學(xué)雜志《科學(xué)》曾刊出一篇文章《最小二乘式》,此為我國第一篇概率論文章。后胡明復(fù)(1891—1927年)曾撰寫《幾率論》、《誤差論》等一系列論文探討概率統(tǒng)計(jì)的哲學(xué)問題[3]。由于受中國傳統(tǒng)數(shù)學(xué)思想的影響,加之近代數(shù)學(xué)基礎(chǔ)薄弱,隨機(jī)數(shù)學(xué)在我國發(fā)展甚是緩慢。直到20世紀(jì)30年代,我國數(shù)學(xué)家褚一飛、劉炳震、許寶騄、鐘開萊等才陸續(xù)發(fā)表概率論與數(shù)理統(tǒng)計(jì)的研究論文,拉開了中國對概率論與數(shù)理統(tǒng)計(jì)研究的序幕。
許寶騄痛感中國數(shù)學(xué)之落后,懷著滿腔的報(bào)國熱情,決心把自己的事業(yè)立足于祖國。由于概率論與數(shù)理統(tǒng)計(jì)在中國幾乎是空白的學(xué)科領(lǐng)域,于是,許寶騄以驚人毅力和無私奉獻(xiàn)精神為其奠定了基礎(chǔ),并為之振興付出了畢生精力。
在實(shí)際工作及理論問題中,概率接近于1或0的隨機(jī)事件具有重要意義。概率論的一個(gè)基本問題就是探索概率接近于1的規(guī)律,特別是大量獨(dú)立或弱相依因素累積結(jié)果所發(fā)生的規(guī)律。大數(shù)定律就是研究這種規(guī)律的命題之一。許寶騄對大數(shù)定律進(jìn)行了深入探討。
強(qiáng)大數(shù)定律和弱大數(shù)定律取決于收斂的類型。第一個(gè)弱大數(shù)定律由雅可布·伯努利(JacobBernoulli,1654—1705)提出,刻畫了大量經(jīng)驗(yàn)觀測中呈現(xiàn)的穩(wěn)定性。后泊松(SiméonDenisPoisson,1781—1840)又提出了一個(gè)條件更寬的陳述,即泊松大數(shù)定律。
切比雪夫(P.L.Chebyshev,1821—1894)第一次嚴(yán)格地證明了伯努利大數(shù)定律,并把結(jié)果推廣到泊松大數(shù)定律。1866年,切比雪夫給出著名的切比雪夫不等式,并由此導(dǎo)出切比雪夫大數(shù)定律。
第一個(gè)強(qiáng)大數(shù)定律由法國數(shù)學(xué)家博雷爾(EmailBorel,1871—1956)在1909年對伯努利試驗(yàn)場合建立。他證得若試驗(yàn)次數(shù)無限增加時(shí),頻率將趨于概率。博雷爾的工作激起了數(shù)學(xué)家沿這一嶄新方向的一系列探索,其中尤以柯爾莫戈羅夫(A.H.Kolmogorov,1903—1987)的研究最為卓著。他在1926年推導(dǎo)了弱大數(shù)定律成立的充分必要條件,后又對博雷爾提出的強(qiáng)大數(shù)定律給出了一般結(jié)果。
許寶騄進(jìn)一步加強(qiáng)了強(qiáng)大數(shù)定律的結(jié)論。其結(jié)果為:設(shè)X1,X2,⋯,Xn,⋯是獨(dú)立同分布均值為零、方差有限的隨機(jī)變量序列,任給ε>0,有Σ∞n=1P1n|X1+X2+⋯Xn|>ε<∞證明是經(jīng)過一個(gè)卷積的富立葉逆轉(zhuǎn),把問題轉(zhuǎn)化為含有特征函數(shù)某個(gè)積分的分片估計(jì),這需要具有相當(dāng)深厚的數(shù)學(xué)功底和敏銳的數(shù)學(xué)眼光才能完成。由于推證較復(fù)雜,盡管已經(jīng)得出關(guān)于矩的充要條件,但在刊出時(shí)刪去了必要性的證明[4]。
概率論中的極限定理研究的是隨機(jī)變量序列的某種收斂性,對隨機(jī)變量收斂性的不同定義將導(dǎo)致不同的極限定理。許寶騄在“依分布收斂”、“依概率收斂”、“r2階收斂”和“依概率1收斂”的基礎(chǔ)上,創(chuàng)造性地提出“完全收斂性”概念,開辟了概率論極限理論研究的新局面。直到今天,對完全收斂性的討論仍是一個(gè)有意義的課題,這就足以表明該文的開創(chuàng)性價(jià)值。正如許寶騄所說:“一篇論文不能因?yàn)楂@得發(fā)表就有了價(jià)值。其真正價(jià)值要看發(fā)表后被引用的狀況來評價(jià)?!盵1]許寶騄對中心極限定理也進(jìn)行了較為深入的研究?!爸行臉O限定理”這個(gè)術(shù)語是由波利亞(G.Polya,1887—1985)1920年引入的。該定理斷言在適當(dāng)條件下,大量獨(dú)立隨機(jī)變量和的概率分布近似于正態(tài)分布。在長達(dá)兩個(gè)世紀(jì)的時(shí)間內(nèi)極限定理成了概率論的中心課題。
1733年,棣莫弗(A.DeMoivre,1667—1754)由二項(xiàng)分布的漸進(jìn)分布推導(dǎo)出正態(tài)分布。較一般的極限定理由拉普拉斯(Pierre2SimonMarquisdeLaplace,1749—1827)給出,但其證明不完善。
誤差分析是概率論的生長點(diǎn)之一。如果把隨機(jī)變量總和中的每項(xiàng)看作是小的“基本誤差”,那么中心極限定理就為觀察誤差中正態(tài)分布的發(fā)生給出一個(gè)解釋。19世紀(jì)初高斯(C.F.Gauss,1777—1855)在研究測量誤差時(shí)引進(jìn)了正態(tài)分布,并發(fā)展了具有廣泛應(yīng)用的最小二乘法。
在許多數(shù)學(xué)家為給出中心極限定理嚴(yán)格證明所做的努力均告失敗后,切比雪夫使用矩方法的嘗試相當(dāng)令人鼓舞。馬爾科夫(A.A.Markov,1856—1922)于1887年第一個(gè)用矩方法給出了中心極限定理的嚴(yán)格證明。切比雪夫的另一個(gè)弟子李雅普諾夫(A.M.Lyapunov,1857—1918)則從一個(gè)全新角度去考察中心極限定理,引入特征函數(shù)這一有力工具,避免了矩方法所要求的高階矩存在的苛刻條件,在1901年給出了定理的完善證明,其證明方法與現(xiàn)在素?cái)?shù)理論中的方法相類似。特征函數(shù)實(shí)現(xiàn)了數(shù)學(xué)方法的革命,為極限定理的進(jìn)一步精確化提供了條件。
一個(gè)從理論和應(yīng)用上都應(yīng)當(dāng)關(guān)心的問題是,僅知道某個(gè)概率分布漸近正態(tài)分布是不夠的,還必須知道換成正態(tài)分布后誤差有多大。李雅普諾夫給出這個(gè)誤差的一個(gè)上限。瑞典數(shù)學(xué)家克拉美(H.Cramér,1893—1985)發(fā)現(xiàn)李雅普諾夫所給余數(shù)的估計(jì)在風(fēng)險(xiǎn)問題中是遠(yuǎn)遠(yuǎn)不夠的,并于1928年改進(jìn)了結(jié)果。1941年,貝萊(A.C.Berry)再次改進(jìn)了李雅普諾夫的結(jié)果。
許寶騄有一本翻破了的克拉美概率著作,書上幾乎寫滿了批注。他認(rèn)為該書包含了所有概率論的基礎(chǔ)。1945年,許寶騄改進(jìn)了克拉美定理和貝萊定理,并給出克拉美定理的一個(gè)初等證明[5]。他以特征函數(shù)為工具,通過12個(gè)引理,給出了上述定理的證明。但影響更深遠(yuǎn)的結(jié)果是他將相應(yīng)的樣本均值代之以樣本方差。許寶騄說:“關(guān)于均值的漸近分布,已知結(jié)果如此之多??寄崴?Cornish)和費(fèi)希爾(R.A.Fisher,1890—1962)通過半不變量獲得了逐步近似于任何隨機(jī)變量分布的各項(xiàng)。若把考尼斯和費(fèi)希爾的形式結(jié)果轉(zhuǎn)化為一條漸近展開的數(shù)學(xué)定理,它能給出剩余項(xiàng)大小的階。在本文中,樣本方差就做到了這一步?!盵5]
這里許寶騄第一個(gè)討論了樣本方差的漸近展開,給出余項(xiàng)階的估計(jì)。他直接引進(jìn)了一個(gè)新維數(shù),用特征函數(shù)來近似隨機(jī)向量的分布,其難點(diǎn)是用特征函數(shù)來近似兩個(gè)高度相關(guān)的隨機(jī)變量的分布。他對特征函數(shù)的應(yīng)用已經(jīng)達(dá)到爐火純青的境界,在不少論文中對這一技巧信手拈來,應(yīng)用自如。
許寶騄所采用的方法具有普遍意義,還可以用于解決樣本高階中心矩、樣本相關(guān)系數(shù)及樣本統(tǒng)計(jì)量的類似問題。他的這一工作在20世紀(jì)70年代以后引起了進(jìn)一步的研究。此后,許寶騄開始研究費(fèi)勒(W.Feller,1906—1970)對中心極限定理一般形式的充要條件。1947年5月,他得到每行獨(dú)立的無限小隨機(jī)變量三角陣列的行和,依分布收斂于一給定的無窮可分律的充要條件。當(dāng)時(shí)一些著名的概率專家,如柯爾莫戈羅夫、辛欽(A.Ya.Khintchine,1894—1959)、格涅堅(jiān)科(B.V.Gnedenko,1912—1995)、萊維(PaulLévy,1886—1971)和費(fèi)勒等,都在尋找這一答案,所以許寶騄在給鐘開萊的信中說,擔(dān)心正在進(jìn)行的工作會和別人相重復(fù)。
許寶騄的條件與格涅堅(jiān)科的不同,后者的“兩個(gè)尾巴”是并在一起的,而許寶騄則利用核(sint/t)3直接證明。但得知格涅堅(jiān)科的研究成果已經(jīng)發(fā)表時(shí),許寶騄立即承認(rèn)了其優(yōu)先權(quán)[6]。因此,在格涅堅(jiān)科和柯爾莫戈羅夫合著的相關(guān)專著英譯本再版時(shí),添加了許寶騄的這一論文作為附錄。
20世紀(jì)50年代中期,許寶騄對馬爾科夫過程產(chǎn)生了興趣,他用分析的方法討論了關(guān)于轉(zhuǎn)移概率函數(shù)的可微性。這一工作暗示了分析結(jié)構(gòu)和概率結(jié)構(gòu)的內(nèi)在聯(lián)系,為進(jìn)一步研究奠定了基礎(chǔ)。
2涉足統(tǒng)計(jì)推斷領(lǐng)域
貝葉斯(T.Bayes,1702—1761)的論文《論機(jī)會學(xué)說問題的求解》可看作最早的一種統(tǒng)計(jì)推斷程序。拉普拉斯和高斯等利用貝葉斯公式估計(jì)參數(shù)的研究,促使統(tǒng)計(jì)學(xué)擺脫觀測數(shù)據(jù)的單純描述而向強(qiáng)調(diào)推斷的階段過渡。
19世紀(jì)末,皮爾遜(K.Pearson,1857—1936)明確指出,統(tǒng)計(jì)學(xué)不是研究樣本本身而是要根據(jù)樣本對總體進(jìn)行推斷,并引進(jìn)一個(gè)分布族,包含正態(tài)分布及現(xiàn)在已知的一些重要非正態(tài)分布,還提出矩估計(jì)法,用來估計(jì)分布族中的參數(shù)[7]。皮爾遜所提出的檢驗(yàn)擬合優(yōu)度統(tǒng)計(jì)量,為大樣本統(tǒng)計(jì)的先驅(qū)性工作。戈塞特(W.S.Gosset,1876—1937)1908年導(dǎo)出的t分布,則開了小樣本理論的先河。小樣本理論強(qiáng)調(diào)樣本必須從總體中隨機(jī)抽取,從而使統(tǒng)計(jì)學(xué)研究對象從群體現(xiàn)象轉(zhuǎn)變?yōu)殡S機(jī)現(xiàn)象。
20世紀(jì)20年代費(fèi)希爾對現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)的形成和發(fā)展做出了卓越貢獻(xiàn)。他發(fā)展了正態(tài)總體下種種統(tǒng)計(jì)量的抽樣分布理論,建立了以最大似然估計(jì)為中心的點(diǎn)估計(jì)理論,創(chuàng)立了實(shí)驗(yàn)設(shè)計(jì),并發(fā)展了相應(yīng)的數(shù)據(jù)分析方法———方差分析。
1911年,皮爾遜應(yīng)聘為倫敦大學(xué)學(xué)院優(yōu)生學(xué)教授,并任生物統(tǒng)計(jì)系主任,而費(fèi)希爾自1933年起任倫敦大學(xué)學(xué)院教授。他們共同建立和領(lǐng)導(dǎo)了一個(gè)有世界影響的數(shù)理統(tǒng)計(jì)學(xué)派,使倫敦大學(xué)學(xué)院的高爾頓實(shí)驗(yàn)室和統(tǒng)計(jì)系成為世界數(shù)理統(tǒng)計(jì)學(xué)的研究中心。
1936年許寶騄來到高爾頓實(shí)驗(yàn)室和統(tǒng)計(jì)系學(xué)習(xí)時(shí),小皮爾遜(E.S.Person,1895—1980)剛繼任父親的領(lǐng)導(dǎo)工作,任統(tǒng)計(jì)系主任;費(fèi)希爾任高爾頓實(shí)驗(yàn)室主任;現(xiàn)代統(tǒng)計(jì)學(xué)家奈曼(J.Neyman,1894—1981)任統(tǒng)計(jì)系教授;一些著名學(xué)者也不斷來訪,如美國的多元分析專家郝太林(H.Hotelling,1895—1973)、頻率曲線專家克萊格(C.C.Craig)和概率專家費(fèi)勒等。頻頻接觸這些“世界級”人物,其發(fā)現(xiàn)一般原理、發(fā)現(xiàn)科學(xué)實(shí)質(zhì)的深邃思想,其才氣橫溢、思如泉涌的大家風(fēng)范,其刻苦鉆研、鍥而不舍的科學(xué)精神,都給天資聰慧的許寶騄留下了深刻印象。這對其概率統(tǒng)計(jì)思想的形成和發(fā)展產(chǎn)生了很大影響,他一生的科學(xué)貢獻(xiàn)與這段經(jīng)歷是密切相關(guān)的。
在奈曼.皮爾遜的假設(shè)檢驗(yàn)理論建立之初,將這一方法應(yīng)用于線性模型的線性假設(shè)檢驗(yàn)問題是一個(gè)很有意義的研究方向。費(fèi)希爾對線性模型的線性假設(shè)發(fā)展了F檢驗(yàn)(起初他稱之為Z檢驗(yàn),其學(xué)生改進(jìn)為F檢驗(yàn),用Fisher的第一個(gè)字母命名),但這種檢驗(yàn)有何優(yōu)越性或是否存在比它更優(yōu)越的檢驗(yàn),尚需進(jìn)一步探討。奈曼2皮爾遜理論提供了以比較功效函數(shù)為基礎(chǔ)的方法,涉及到很復(fù)雜的精細(xì)分析問題,在當(dāng)時(shí)的統(tǒng)計(jì)隊(duì)伍中,具備這樣數(shù)學(xué)素質(zhì)的為數(shù)甚少,許寶騄正是其中的突出者。他敏銳地意識到該課題的重要性,并隨之進(jìn)行了精心研究,發(fā)表了一系列相關(guān)論文,取得了突破性進(jìn)展,從而在國際數(shù)理統(tǒng)計(jì)界爭得一席之地。
28歲的許寶騄在奈曼和皮爾遜《統(tǒng)計(jì)研究報(bào)告》的第二卷發(fā)表了關(guān)于數(shù)理統(tǒng)計(jì)學(xué)的第一篇論文《Studentt分布理論用于兩樣本問題》,研究了所謂Behrens2Fisher問題。[8]他創(chuàng)造性地引進(jìn)統(tǒng)計(jì)量u=(X-Y)2(A1S21+A2S22)
其中A1>0,A2>0為常數(shù),來討論以|u|>c為否定域的檢驗(yàn)。許寶騄通過把u的密度函數(shù)展開成冪級數(shù),研究了否定域|u|>c的勢函數(shù)對參數(shù)的依賴關(guān)系。其主要內(nèi)容是計(jì)算上述U檢驗(yàn)的功效函數(shù),并研究該檢驗(yàn)在種種情況下的表現(xiàn)[9]。這是一個(gè)精確的(不是漸進(jìn)的)分析,當(dāng)代統(tǒng)計(jì)學(xué)家謝非(H.Scheffe)稱之為“數(shù)學(xué)嚴(yán)密性的范本”。據(jù)許寶騄的研究結(jié)果所給出的方法后被稱為“許方法”。
1941年,許寶騄首次證明了方差分析中的F檢驗(yàn)在功效函數(shù)觀點(diǎn)下的優(yōu)越性。方差分析中任一個(gè)效應(yīng)有無的檢驗(yàn),都可以化為典則形式之下的假設(shè)。他證得若假設(shè)水平α的檢驗(yàn)不是F檢驗(yàn),其功效函數(shù)在任一球面上保持常數(shù),則此檢驗(yàn)的功效必小于水平α的F檢驗(yàn)的功效[10]。這是一元線性假設(shè)似然比檢驗(yàn)的第一個(gè)優(yōu)良性質(zhì),其本質(zhì)上是對任何特定多于一個(gè)參數(shù)值假設(shè)的第一個(gè)非局部的優(yōu)良性質(zhì)。許寶騄考察了高斯2馬爾科夫模型中方差的最優(yōu)估計(jì)問題,得到了樣本方差為總體方差的最優(yōu)二次無偏估計(jì)的充要條件。后來的研究表明,許寶騄的結(jié)果是近年來研究方差分量模型和方差最優(yōu)二次估計(jì)的起點(diǎn)。
許寶騄證明了似然比檢驗(yàn)在所有功效函數(shù)僅依賴于一個(gè)非中心參數(shù)的所有檢驗(yàn)中是一致最強(qiáng)的。這個(gè)條件等價(jià)于勢函數(shù)在某一類自然變換下的不變性,由此開創(chuàng)了假設(shè)檢驗(yàn)的兩個(gè)發(fā)展方向:(1)將所得形式推廣到多元問題(郝太林的T2及多元相關(guān)系數(shù));(2)提供了獲得所有相似檢驗(yàn)的新方法。
正是在許寶騄的建議下,其學(xué)生席瑪卡(J.B.Simaika)和萊曼(E.L.Lehmann)將這個(gè)方法用于其他問題,后萊曼和謝飛形成了完備性的概念。
3推進(jìn)多元分析發(fā)展
皮爾遜的數(shù)理統(tǒng)計(jì)學(xué)建立在自然總體的“大樣本”基礎(chǔ)上,而費(fèi)希爾則著重處理受控實(shí)驗(yàn)中“小樣本”的統(tǒng)計(jì)分析。后者在數(shù)學(xué)上占有優(yōu)勢,頻頻對前者發(fā)起攻擊,尖銳地批評皮爾遜所提出的x2檢驗(yàn)。
奈曼和小皮爾遜在1933年發(fā)表了關(guān)于假設(shè)檢驗(yàn)的論文,把檢驗(yàn)問題作為一個(gè)數(shù)學(xué)最優(yōu)化問題來處理,發(fā)展了費(fèi)希爾的研究工作。由于費(fèi)希爾對皮爾遜有成見,因而對奈曼和小皮爾遜的研究也不以為然,甚至稱其編輯的《統(tǒng)計(jì)學(xué)研究通報(bào)》是“一堆破爛貨”。由于和費(fèi)希爾的矛盾,奈曼感到在英國難以發(fā)展,于1938年4月應(yīng)聘為美國加州伯克利大學(xué)數(shù)學(xué)系教授,并籌建了統(tǒng)計(jì)實(shí)驗(yàn)室。
加州伯克利大學(xué)統(tǒng)計(jì)實(shí)驗(yàn)室在二戰(zhàn)后逐步取代了倫敦大學(xué)學(xué)院的統(tǒng)計(jì)系地位,成為世界數(shù)理統(tǒng)計(jì)學(xué)的中心。相比之下,當(dāng)時(shí)蘇聯(lián)在概率論領(lǐng)域雖領(lǐng)先于世界,但在數(shù)理統(tǒng)計(jì)領(lǐng)域遠(yuǎn)遠(yuǎn)落后于美國。在20世紀(jì)50年代大力倡導(dǎo)“學(xué)習(xí)蘇聯(lián)”時(shí)期,中國統(tǒng)計(jì)學(xué)也長時(shí)期得不到發(fā)展。
奈曼猶如伯樂,慧眼識俊才。他非常器重許寶騄,認(rèn)為許寶騄是新一代數(shù)理統(tǒng)計(jì)學(xué)家中的佼佼者,一度選定其為接班人。1945年,奈曼邀請?jiān)S寶騄參加了第一屆伯克利概率統(tǒng)計(jì)討論會,并聘請他為伯克利統(tǒng)計(jì)實(shí)驗(yàn)室教師。校方僅聘許寶騄為講師,奈曼為此大聲疾呼,表示了強(qiáng)烈不滿。1946年秋,許寶騄開始在教堂山(ChapelHill)教學(xué),奈曼還曾去看過他。當(dāng)許寶騄回國時(shí),奈曼一再挽留,想把他爭回自己的麾下。回國后,許寶騄也與奈曼保持了多年的聯(lián)系。許寶騄對科學(xué)所做的貢獻(xiàn)以及孜孜以求的好學(xué)精神,是與奈曼的教誨和影響分不開的。
如果個(gè)體的觀測數(shù)據(jù)能表示為P維歐幾里得空間的點(diǎn),那么這樣的數(shù)據(jù)叫做多元數(shù)據(jù),而分析多元數(shù)據(jù)的統(tǒng)計(jì)方法稱為多元統(tǒng)計(jì)分析。主要多元分析方法有:多重回歸分析、判別分析、聚類分析、對應(yīng)分析、典型相關(guān)分析、多元方差分析等。許寶騄在哥倫比亞大學(xué)和教堂山講授多元統(tǒng)計(jì)分析,培養(yǎng)學(xué)生從事這一領(lǐng)域的研究。
自20世紀(jì)30年代起,費(fèi)希爾、郝太林、許寶騄等做出了一系列奠基性的工作,使多元統(tǒng)計(jì)分析在理論上得到迅速發(fā)展。1938年到1945年,許寶騄所發(fā)表的相關(guān)論文一直處在多元統(tǒng)計(jì)分析理論的前沿。在多元分析假設(shè)檢驗(yàn)理論中,許寶騄最先討論了優(yōu)良性,是奈曼-皮爾遜的假設(shè)檢驗(yàn)理論在多元分析中應(yīng)用的先導(dǎo)。他推進(jìn)了矩陣論在數(shù)理統(tǒng)計(jì)理論中的應(yīng)用。許寶騄把矩陣論中處理問題的方法引進(jìn)了數(shù)理統(tǒng)計(jì)的研究,實(shí)質(zhì)上這是一個(gè)長方陣在某一變換群下的標(biāo)準(zhǔn)型。有了線性模型的法式,使估計(jì)和假設(shè)檢驗(yàn)問題變得十分簡明。
費(fèi)希爾創(chuàng)立的“n維幾何”方法,使數(shù)學(xué)家們獲得了一些重要統(tǒng)計(jì)量的精確分布。典型例子是1928年維夏特(J.Wishart)導(dǎo)出了任意維正態(tài)樣本全體二階矩的聯(lián)合分布———維夏特分布。
不少學(xué)者給出維夏特分布的不同證明。1939年,許寶騄利用數(shù)學(xué)歸納法推導(dǎo)出維夏特分布。他假定對n-1,p-1成立來推導(dǎo)對n,p的密度函數(shù)。除了密度函數(shù)中的矩陣外,還需要一個(gè)(p-1)維的正態(tài)向量和一個(gè)n維的正態(tài)變量,在證明過程中所需的分析推導(dǎo)僅僅是n維向量模的平方是x2n分布[11]。專家們一致認(rèn)為許寶騄的推導(dǎo)方法是最優(yōu)美的一個(gè)。
文中許寶騄的另一個(gè)杰作就是得到了現(xiàn)今所稱的許氏公式:當(dāng)n≥p≥1時(shí),有
∫⋯∫f(x′x)dxn×p=πnp2-p4(p-1)Πp-1j=OΓ(n-j2)∫A>0⋯∫|A|n-p-12f(A)dA
該公式是處理20世紀(jì)80年代所形成的橢球等高分布統(tǒng)計(jì)量的有力工具。
多元分析中一個(gè)基本分布是關(guān)于隨機(jī)正定陣相對特征根的分布。線性模型中線性假設(shè)的檢驗(yàn)問題,都與這些特征根有關(guān)。若正定隨機(jī)矩陣A和B相互獨(dú)立,各自遵從維夏特分布W(m,Σp×p)和W(n,Σ),且m≥p,n≥p,θ1≥⋯≥θp≥0表示|A-θ(A+B)|=0
的p個(gè)根,尋求θ1,⋯,θp的聯(lián)合密度是一個(gè)重要研究課題。在20世紀(jì)30年代末,許寶騄和一些著名統(tǒng)計(jì)學(xué)家,都對其進(jìn)行了探討。在眾多方法中,許寶騄的方法嚴(yán)密而清晰,他以矩陣微分為工具,計(jì)算了一些復(fù)雜變換的雅可比行列式,而導(dǎo)出相應(yīng)的分布[12]。
這個(gè)方法的難點(diǎn)是計(jì)算雅可比行列式,許寶騄在文章中給出了任意階的雅可比行列式結(jié)果,并證明了3階行列式情形。其學(xué)生安德遜(T.W.Anderson)詳細(xì)介紹了這一工作,認(rèn)為某些雅可比行列式的計(jì)算是許寶騄的杰作。
許寶騄把數(shù)學(xué)家分成三流。第一流的數(shù)學(xué)家是天才,他們能開創(chuàng)新的領(lǐng)域,如柯爾莫哥洛夫、諾依曼(JohnvonNeumann,1903—1957)、維納(NorbertWiener,1894—1964)等。第二流數(shù)學(xué)家是靠刻苦學(xué)習(xí)而成功的。他們認(rèn)真消化整理前人的東西,在此基礎(chǔ)上有所創(chuàng)造和發(fā)現(xiàn),辛欽就屬于這一類。第三流的數(shù)學(xué)家只是在某個(gè)問題上有所貢獻(xiàn),不能像第二流的那樣系統(tǒng)工作。剩下的就是不入流的數(shù)學(xué)家了。他認(rèn)為自己沒有才能,所有成就完全是靠刻苦學(xué)習(xí)而獲得。
“三十功名塵與土,八千里路云和月”。許寶騄對科學(xué)研究的態(tài)度和精神永遠(yuǎn)值得我們借鑒和學(xué)習(xí)。
參考文獻(xiàn)
1吳文俊.世界著名數(shù)學(xué)家傳記[M].北京:科學(xué)出版社,1990.
2江澤涵,段學(xué)復(fù).深切懷念許寶騄教授[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,1980,(3):1—3.
3張奠宙.中國近現(xiàn)代數(shù)學(xué)的發(fā)展[M].石家莊:河北科學(xué)技術(shù)出版社,2000.
4Pao-LuHsu,pleteConvergenceandtheLawofLargeNumber[J].Proc.Nat.Acad.Sci.U.S.A.,1947,33:25—31.
5Pao-LuHsu.TheApproximateDistributionoftheMeanandVarianceofaSampleofIndependentVariables[J].Ann.Math.Statist,1945,16:1—29.
6鐘開萊.許寶騄在概率論方面的工作[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,1980,(3):12—15.
7陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡史[M].長沙:湖南教育出版社,2005.
8MorrisLE,RichardAO.RandomQuotientsandtheBehrens2FisherProblem[J].AnnMathStatist,1972,43:1852—1860.
9Pao-LuHsu.ContributionstotheTwo-sampleProblemandtheTheoryofthe“StudentpsT-test[J].Statist.Res.Mem,1938,2:1—24.
10Pao-LuHsu.OntheBestQuadraticEstimateoftheVariance[J].Statist.Res.Mem,1938,2:91—104.
11Pao-LuHsu.AnalysisofVariancefromthePowerFunctionStandpoint[J].Biometrika,1941,32:62—69.
12Pao-LuHsu.ANewProofoftheJointProductMomentDistributions[J].Proc.CambrigePhilos.Soc.,1939,35:336—338.
摘要許寶騄是中國最早在概率論與數(shù)理統(tǒng)計(jì)研究方面達(dá)到世界先進(jìn)水平的杰出數(shù)學(xué)家。他奠定了中國概率論與數(shù)理統(tǒng)計(jì)學(xué)科的基礎(chǔ),并為之付出了畢生精力。其研究成果已成為當(dāng)代概率論與數(shù)理統(tǒng)計(jì)理論的重要組成部分,至今“許方法”仍被認(rèn)為是解決檢驗(yàn)問題的最實(shí)用方法。
關(guān)鍵詞許寶騄概率論數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)多元分析