醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析

時(shí)間:2022-05-29 08:28:53

導(dǎo)語:醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析

摘要:針對醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題以及稿件退修和編輯加工過程中遇到的共性的統(tǒng)計(jì)學(xué)問題進(jìn)行分析,并提出可能避免統(tǒng)計(jì)學(xué)方面錯(cuò)誤的方法及建議,便于科研人員撰寫論文時(shí)學(xué)習(xí)借鑒,也為醫(yī)學(xué)期刊編輯處理類似稿件提供參考。

關(guān)鍵詞:統(tǒng)計(jì)學(xué);醫(yī)學(xué);科研;論文;問題

醫(yī)學(xué)統(tǒng)計(jì)學(xué)是現(xiàn)代醫(yī)學(xué)研究的重要方法和技術(shù)手段,是醫(yī)學(xué)科研論文中不可或缺的部分,其應(yīng)用水平直接影響科研成果的質(zhì)量[1]。醫(yī)學(xué)科研人員在撰寫論文時(shí)若未能仔細(xì)鉆研流行病學(xué)和衛(wèi)生統(tǒng)計(jì)學(xué)等專業(yè)知識(shí),或未咨詢專業(yè)統(tǒng)計(jì)學(xué)研究人員,盲目套用統(tǒng)計(jì)學(xué)方法,往往會(huì)造成應(yīng)用統(tǒng)計(jì)學(xué)方法及處理數(shù)據(jù)時(shí)出現(xiàn)錯(cuò)誤,如變量選擇和納入、模型選擇、結(jié)果描述等錯(cuò)用情況發(fā)生。在醫(yī)學(xué)研究設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)整理、結(jié)果解釋和表達(dá)等環(huán)節(jié)均有可能存在統(tǒng)計(jì)學(xué)應(yīng)用不當(dāng)?shù)膯栴}[2‐5]。就已發(fā)表的醫(yī)學(xué)科技論文來看,研究設(shè)計(jì)環(huán)節(jié)中存在的問題在審稿時(shí)比較容易被識(shí)別,且大部分存在科研設(shè)計(jì)缺陷的論文在審稿階段已濾除,而運(yùn)用統(tǒng)計(jì)學(xué)方法分析資料,應(yīng)用統(tǒng)計(jì)學(xué)軟件實(shí)現(xiàn)數(shù)據(jù)管理和分析,正確解釋和表達(dá)統(tǒng)計(jì)分析結(jié)果等問題則往往比較隱蔽,這部分問題在進(jìn)入編輯修稿階段才顯現(xiàn)。編輯修稿階段是論文出版前的最后質(zhì)量控制環(huán)節(jié),編輯對論文統(tǒng)計(jì)學(xué)問題的審核把關(guān)起著至關(guān)重要的作用,因此,需要期刊編輯具有過硬的專業(yè)知識(shí)、嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度及高度的責(zé)任心處理遺留錯(cuò)誤,特別是有些疑難問題往往需要專業(yè)統(tǒng)計(jì)學(xué)人員介入進(jìn)行判斷。已有調(diào)查顯示,1990年—2003年發(fā)表在NEnglJMed、JAMA和Lancet三大頂尖醫(yī)學(xué)雜志上且引用次數(shù)超過1000次的文獻(xiàn)中,有近1/3的文獻(xiàn)存在統(tǒng)計(jì)學(xué)問題[6‐7]??梢娊y(tǒng)計(jì)學(xué)誤用、錯(cuò)用問題在醫(yī)學(xué)期刊中相對較多。因此,對于醫(yī)學(xué)期刊社而言,強(qiáng)調(diào)在論文審稿階段邀請統(tǒng)計(jì)專業(yè)審稿專家進(jìn)行統(tǒng)計(jì)方面把關(guān)十分重要?,F(xiàn)就醫(yī)學(xué)論文中常見的統(tǒng)計(jì)學(xué)問題及可能的避免方法分析如下,以饗同道共勉。

1描述性分析時(shí)存在的統(tǒng)計(jì)學(xué)問題

定量資料中的連續(xù)性資料一般采用集中趨勢加離散趨勢形式描述,例如均數(shù)±標(biāo)準(zhǔn)差(x±s)及中位數(shù)(四分位數(shù)間距)。目前,絕大部分文獻(xiàn)統(tǒng)計(jì)描述都以均數(shù)±標(biāo)準(zhǔn)差形式進(jìn)行,研究者往往未檢驗(yàn)所研究指標(biāo)數(shù)據(jù)的正態(tài)性,而理所應(yīng)當(dāng)?shù)貙?shù)據(jù)以正態(tài)方式進(jìn)行呈現(xiàn),忽略了非正態(tài)分布數(shù)據(jù)應(yīng)當(dāng)采用中位數(shù)(四分位數(shù)間距)的形式來描述比較妥當(dāng),這樣的錯(cuò)誤使用可能會(huì)讓讀者對數(shù)據(jù)總體分布造成錯(cuò)誤判斷。此外,某些研究中研究者會(huì)采用均數(shù)±標(biāo)準(zhǔn)誤進(jìn)行統(tǒng)計(jì)描述。一方面,可能是因?yàn)檠芯空邔?biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差的具體含義辨識(shí)不準(zhǔn)確,樣本標(biāo)準(zhǔn)差是用來描述正態(tài)分布數(shù)據(jù)離散程度的統(tǒng)計(jì)量,是將方差開平方即得到的標(biāo)準(zhǔn)差;而樣本標(biāo)準(zhǔn)誤是指樣本均數(shù)的標(biāo)準(zhǔn)差,是一個(gè)統(tǒng)計(jì)推斷的指標(biāo),用于將統(tǒng)計(jì)量推斷到總體參數(shù)。另一方面,由于樣本標(biāo)準(zhǔn)誤一般比標(biāo)準(zhǔn)差小,出于使研究結(jié)果看上去更具優(yōu)勢考慮,研究者會(huì)使用標(biāo)準(zhǔn)誤代替標(biāo)準(zhǔn)差。

2統(tǒng)計(jì)分析方法不滿足假設(shè)條件

2.1不滿足參數(shù)檢驗(yàn)的數(shù)據(jù)采用了參數(shù)檢驗(yàn)方法

2.1.1不滿足正態(tài)性在進(jìn)行兩組或多組定量資料參數(shù)檢驗(yàn)時(shí),相比于獨(dú)立性和方差齊性,數(shù)據(jù)正態(tài)性往往容易被忽視。首先需注意,獨(dú)立樣本t檢驗(yàn)或方差分析對正態(tài)分布的要求有一定耐性。如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)不是嚴(yán)重地偏離正態(tài)分布,且樣本量比較大,仍可以采用參數(shù)檢驗(yàn)方法。但如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)偏態(tài)嚴(yán)重,且樣本量不大,不建議使用參數(shù)檢驗(yàn)方法,推薦采用非參數(shù)檢驗(yàn)對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。但當(dāng)樣本量很大時(shí)(如>200),即使呈兩點(diǎn)分布或指數(shù)分布,其樣本t統(tǒng)計(jì)量也近似服從正態(tài)分布[8]。在這種情況下,選用參數(shù)檢驗(yàn)或非參數(shù)檢驗(yàn)均可。2.1.2重復(fù)測量數(shù)據(jù)對于重復(fù)測量數(shù)據(jù)的分析方法,大部分科研工作者首先想到的是重復(fù)測量方差分析[9],其具有結(jié)果呈現(xiàn)形式簡單、易于解釋的優(yōu)點(diǎn),但其前提條件相對較多且通常不易滿足。比如需要平衡數(shù)據(jù),這就要求所有觀測不能有缺失值,否則相應(yīng)的觀測對象需要被刪除。此外,重復(fù)測量方差分析還要求相應(yīng)變量之間的等相關(guān)性以及資料的球形對稱性(可以理解為復(fù)雜情況下的方差齊性),若這些條件不滿足,參數(shù)檢驗(yàn)的方法將不再適用,只能采用邊際多層模型或線性混合模型等進(jìn)行分析。

2.2不滿足卡方檢驗(yàn)條件的數(shù)據(jù)采用了卡方檢驗(yàn)

兩獨(dú)立樣本四格表資料的卡方檢驗(yàn)要求總例數(shù)n≥40且理論頻數(shù)T≥5[10]。若n≥40,且T為1~<5,采用連續(xù)校正的卡方或Fisher精確概率法進(jìn)行檢驗(yàn);若n<40或T<1,則采用Fisher精確概率法進(jìn)行檢驗(yàn)。配對四格表資料卡方檢驗(yàn)要求不一致對子b+c≥40,否則采用校正卡方檢驗(yàn)。R×C表資料卡方檢驗(yàn)中要求不宜有1/5以上的格子T<5,不宜有格子T<1,否則需采用Fisher精確概率法進(jìn)行統(tǒng)計(jì)分析。

2.3不滿足線性回歸條件的數(shù)據(jù)采用了線性回歸分析

線性回歸模型的前提條件包括線性、獨(dú)立性、正態(tài)性和方差齊性。其中,線性是指因變量的總體平均值與自變量呈線性關(guān)系??梢酝ㄟ^繪制散點(diǎn)圖判斷回歸關(guān)系是否成立[11]。獨(dú)立性是指任意2條記錄互相獨(dú)立。正態(tài)性是指模型的誤差項(xiàng)需服從正態(tài)分布(等價(jià)于當(dāng)自變量X為定值時(shí)因變量Y也呈正態(tài)分布),而在樣本量較大時(shí)可以忽略正態(tài)性要求。方差齊性是指在自變量X的取值范圍內(nèi),不論X取什么值,Y都具有相同的方差,等價(jià)于殘差的方差齊性。需要注意的是,線性、正態(tài)性和方差齊性通常通過繪制散點(diǎn)圖或正態(tài)概率圖等即可快速判斷,但獨(dú)立性往往容易被研究人員忽視,即納入分析的研究對象不應(yīng)有多條記錄,如果有部分研究對象有多條記錄,則應(yīng)只保留一條記錄,否則不能采用線性回歸模型進(jìn)行分析,只能改用混合效應(yīng)模型進(jìn)行分析。同時(shí),還需注意,如果是多因素回歸分析,則上述線性、正態(tài)性和方差齊性的條件應(yīng)在各變量和因變量之間均得以滿足。

3結(jié)果闡釋時(shí)存在的問題

3.1受制于P值,未按常用界值對數(shù)據(jù)進(jìn)行劃分

在進(jìn)行多元回歸分析之前,比較可取的是先進(jìn)行單因素回歸分析。如某單因素為連續(xù)型變量,且已知其為結(jié)局變量的危險(xiǎn)因素可能性較大,若將其直接納入模型進(jìn)行單因素回歸分析,則可能發(fā)現(xiàn)其回歸系數(shù)β無統(tǒng)計(jì)學(xué)意義(P>0.05),這時(shí)某些研究者可能會(huì)采用將連續(xù)型變量分類的方式以獲得較好結(jié)果,可能為得到較小的P值而未采用常用的有意義界值進(jìn)行劃分,如在研究血壓對某種慢性病的影響時(shí),未按照臨床定義的高血壓界定值對血壓值進(jìn)行分類,而是以在數(shù)據(jù)分析時(shí)獲得最小P值為目標(biāo)取最佳截?cái)嘀颠M(jìn)行分析,這種方法會(huì)使結(jié)果產(chǎn)生較大偏倚。因此,在實(shí)際運(yùn)用時(shí)應(yīng)盡量按照臨床上常用分類標(biāo)準(zhǔn)對連續(xù)型變量進(jìn)行分類。

3.2對沒有統(tǒng)計(jì)學(xué)意義的結(jié)果進(jìn)行過分闡釋

醫(yī)學(xué)研究中常常會(huì)獲得P>0.05的結(jié)果,此時(shí)若以α=0.05為檢驗(yàn)水準(zhǔn)則表示結(jié)果不能拒絕H0假設(shè),但也不能下結(jié)論說H0成立[12]。如研究某因素與阿爾茲海默病間的關(guān)系時(shí),通過多因素回歸分析發(fā)現(xiàn)回歸系數(shù)的P>0.05,此時(shí)可以認(rèn)為這個(gè)回歸結(jié)果不具有統(tǒng)計(jì)學(xué)意義,但在結(jié)果討論中不能以此下結(jié)論認(rèn)為該因素與阿爾茲海默病無關(guān),甚至以此來推翻之前的研究結(jié)論。因?yàn)樵诩僭O(shè)檢驗(yàn)中,利用反證法思想是以假設(shè)H0成立來進(jìn)行推導(dǎo),若能推導(dǎo)出原假設(shè)不成立的結(jié)果,則可以推翻原假設(shè)而證明H1成立,但如果推導(dǎo)出H0成立,則并不能做出任何判斷,只能說明以目前結(jié)果尚不能拒絕H0,而后應(yīng)該思考是否是因?yàn)閷?shí)驗(yàn)樣本量不夠或是統(tǒng)計(jì)效能不夠,以在將來進(jìn)行進(jìn)一步探究。

3.3有統(tǒng)計(jì)學(xué)意義的結(jié)果不一定有實(shí)際臨床意義

臨床實(shí)踐中,兩組或多組差異有統(tǒng)計(jì)學(xué)意義不一定說明差異具有臨床意義,判斷是否具有實(shí)際臨床意義需要結(jié)合研究背景和相關(guān)臨床專業(yè)知識(shí)[13]。最經(jīng)典的例子是研究某種降壓藥的降壓效果。臨床上一般認(rèn)為要使血壓降低10mmHg(1mmHg=0.133kPa)以上才能認(rèn)為具有臨床意義,而如果研究樣本量較大,即使試驗(yàn)組和對照組間血壓相差不到10mmHg,也非常有可能得到P<0.05的結(jié)果,從而得出該藥具有好的臨床應(yīng)用價(jià)值這一不正確結(jié)論。再如,臨床研究較重視病人生活質(zhì)量評價(jià),尤其對心理狀況進(jìn)行評價(jià)時(shí)一般采用相關(guān)量表進(jìn)行測評,對量表測評結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)分析時(shí)得出有統(tǒng)計(jì)學(xué)意義(P<0.05),在分析時(shí)直接推斷出某干預(yù)方法比另一種方法更有效,而未考慮研究對象干預(yù)前水平,可能造成研究結(jié)論科學(xué)性不足。因此,在進(jìn)行相關(guān)療效評價(jià)時(shí),不能僅依據(jù)結(jié)果是否有統(tǒng)計(jì)學(xué)意義,生物學(xué)意義才是最重要的。

3.4在不直接進(jìn)行比較的情況下判斷兩組治療效果

優(yōu)劣干預(yù)在試驗(yàn)條件或試驗(yàn)組中產(chǎn)生了顯著效果,而相應(yīng)的效果在對照條件或?qū)φ战M中不顯著,研究人員有時(shí)會(huì)提出試驗(yàn)組效果比對照組效果要好[14]。這種錯(cuò)誤推斷很常見。如觀察A藥和B藥的治療效果,采用自身前后配對設(shè)計(jì),得到的結(jié)果是A藥治療前后配對t檢驗(yàn)差異有統(tǒng)計(jì)學(xué)意義(P<0.05),而B藥治療前后差異沒有統(tǒng)計(jì)學(xué)意義(P>0.05)。此時(shí),只能下“A藥在其受試者中觀察到顯著藥效,而B藥在其受試者中未觀察到顯著藥效”的結(jié)論,但不能就此認(rèn)為A藥治療效果優(yōu)于B藥。要了解兩組治療效果的差異,需要按非配對t檢驗(yàn)對兩組進(jìn)行直接比較。另外,還有一種情況,即在進(jìn)行多組均值或率的比較時(shí),如果已知A組效應(yīng)優(yōu)于B組(P<0.05),而B組效應(yīng)和C組效應(yīng)差異無統(tǒng)計(jì)學(xué)意義(P>0.05),此時(shí)不能按照數(shù)學(xué)邏輯進(jìn)行推導(dǎo),得出“A組效應(yīng)同樣優(yōu)于C組”的錯(cuò)誤結(jié)論。正確做法應(yīng)當(dāng)是將A組和C組直接進(jìn)行比較。

4可能避免統(tǒng)計(jì)學(xué)錯(cuò)誤的方法及建議

4.1根據(jù)研究目的選擇適宜的統(tǒng)計(jì)分析方法

統(tǒng)計(jì)學(xué)方法的運(yùn)用需要考慮其前提條件[15‐16]。若在實(shí)際應(yīng)用過程中忽視了這些條件,所得出的結(jié)果往往可能也是錯(cuò)誤的。所以在應(yīng)用模型及檢驗(yàn)方法時(shí)需要特別注意其應(yīng)用條件。參數(shù)檢驗(yàn)及大部分模型多要求正態(tài)性及獨(dú)立性[17]。在應(yīng)用前需對數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),若不滿足正態(tài)性,可以考慮通過對數(shù)轉(zhuǎn)換、平方根轉(zhuǎn)換及平方根反正弦變換等方法使數(shù)據(jù)轉(zhuǎn)換成正態(tài)以滿足應(yīng)用條件。若無法轉(zhuǎn)換為正態(tài)性數(shù)據(jù)則可采用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)方法。而在卡方檢驗(yàn)中,若不滿足適用條件可考慮采用合適的合并方法[18]。

4.2切勿過分受制于P值P值是最常用的統(tǒng)計(jì)指標(biāo)

[19‐20],科研設(shè)計(jì)通常會(huì)利用P值得出結(jié)論,但若過分關(guān)注P值,依據(jù)P值處理數(shù)據(jù)或進(jìn)行相關(guān)結(jié)果解釋,有時(shí)會(huì)得出不恰當(dāng)或錯(cuò)誤結(jié)論。P值小于既定檢驗(yàn)水準(zhǔn)不等同于該項(xiàng)結(jié)果就具有臨床或者實(shí)際意義。同理,P值大于檢驗(yàn)水準(zhǔn)也并不能說明該項(xiàng)結(jié)果無效。在實(shí)際數(shù)據(jù)分析及結(jié)果解釋時(shí)應(yīng)客觀分析而不是受制于P值,目前,越來越多地提倡用效應(yīng)值加95%置信區(qū)間來表達(dá)結(jié)果[20],這樣既能進(jìn)行結(jié)果比較,也可以觀察到是否具有臨床實(shí)際指導(dǎo)意義。

4.3科學(xué)地解釋統(tǒng)計(jì)結(jié)果

不同研究設(shè)計(jì)類型要求的統(tǒng)計(jì)方法不同,結(jié)果解釋存在一定差異,這是一個(gè)在實(shí)際工作中常被忽略但卻至關(guān)重要的問題。首先,需正確理解假設(shè)檢驗(yàn)結(jié)果?!安町愑薪y(tǒng)計(jì)學(xué)意義”并不意味著在醫(yī)學(xué)專業(yè)上就是“重要”的。相關(guān)系數(shù)的假設(shè)檢驗(yàn)只能說明相關(guān)關(guān)系是否有統(tǒng)計(jì)學(xué)意義,既不能說明相關(guān)關(guān)系是否密切,也不能說明相關(guān)關(guān)系是否具有醫(yī)學(xué)專業(yè)上的某種意義。其次,需正確解釋不同研究類型數(shù)據(jù)分析結(jié)果。觀察性研究本身已經(jīng)決定了研究結(jié)論的局限性;實(shí)驗(yàn)性研究能夠較好地控制各種混雜因素,對于嚴(yán)謹(jǐn)設(shè)計(jì)的實(shí)驗(yàn)性研究,結(jié)論通常較為可靠,但要注意臨床試驗(yàn)對象是人時(shí),存在諸多心理(如安慰劑效應(yīng)和霍桑效應(yīng))以及倫理問題的局限,下結(jié)論時(shí)需特別謹(jǐn)慎。最后,需正確解釋不同單位數(shù)據(jù)分析結(jié)果。對于研究對象基于學(xué)校、單位或地區(qū)等水平的匯總數(shù)據(jù)所進(jìn)行的分析,如果在個(gè)人水平上下結(jié)論,就需特別嚴(yán)謹(jǐn),注意因果推論時(shí)的邏輯性和正確性。

5小結(jié)

隨著醫(yī)學(xué)科研的快速發(fā)展,不論是科研設(shè)計(jì)本身的合理精確性,還是學(xué)術(shù)論文表達(dá)的嚴(yán)謹(jǐn)性,都需要建立在高度嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度及淵博學(xué)識(shí)的理論基礎(chǔ)上。醫(yī)學(xué)期刊編輯在論文統(tǒng)計(jì)學(xué)問題把關(guān)中起著舉足輕重的作用,編輯在退修稿件時(shí)應(yīng)對統(tǒng)計(jì)學(xué)描述和統(tǒng)計(jì)學(xué)分析中可能存在的問題進(jìn)行全面審核,必要時(shí)協(xié)助作者查找錯(cuò)誤,提出中肯修改建議,如統(tǒng)計(jì)學(xué)描述是否完整、描述是否和實(shí)際一致、統(tǒng)計(jì)方法是否恰當(dāng)、統(tǒng)計(jì)結(jié)果的解釋和表達(dá)是否準(zhǔn)確規(guī)范等[21]。統(tǒng)計(jì)學(xué)作為一門應(yīng)用科學(xué),在實(shí)踐應(yīng)用中不能脫離醫(yī)學(xué)背景,必須緊密結(jié)合醫(yī)學(xué)專業(yè)的實(shí)際問題分析判斷,學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的最終目的是應(yīng)用統(tǒng)計(jì)思維和統(tǒng)計(jì)方法分析和解釋醫(yī)學(xué)中的實(shí)際問題,是以方法學(xué)的角色介入醫(yī)學(xué)研究領(lǐng)域,也是為醫(yī)學(xué)科研發(fā)展保駕護(hù)航的工具。醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的每個(gè)數(shù)據(jù)都有其特定的專業(yè)含義,而不是抽象的機(jī)械數(shù)據(jù),計(jì)算機(jī)軟件并不能識(shí)別數(shù)據(jù)的真正含義,無法確定數(shù)據(jù)是否準(zhǔn)確可靠,即使數(shù)據(jù)符合統(tǒng)計(jì)運(yùn)算規(guī)則,也要辨識(shí)是否有臨床實(shí)際意義,這就需要研究者根據(jù)研究目的,結(jié)合臨床研究受眾實(shí)際情況,正確地分析、表達(dá)研究結(jié)果,科學(xué)合理地推導(dǎo)結(jié)論,通過統(tǒng)計(jì)思維的培養(yǎng),提高醫(yī)學(xué)研究水平,以保證研究結(jié)果的真實(shí)性與科學(xué)性。

作者:王雅潔 李亞琴 單位:山西醫(yī)學(xué)期刊社 山西醫(yī)科大學(xué)第一醫(yī)院