Rosenfeld 等比較了不同年代發(fā)表的文章,在20 世紀(jì)90年代以后有更多的文章使用了統(tǒng)計(jì)推斷,而且比較復(fù)雜的統(tǒng)計(jì)分析方法如多因素分析等也更多的應(yīng)用于臨床研究中,但同時(shí)也存在使用統(tǒng)計(jì)方法欠妥或敘述不清的情況。國內(nèi)耳鼻咽喉科醫(yī)學(xué)科技論文情況近似,熊國強(qiáng)等分析了2000 年到2001 年“中國耳鼻咽喉顱底外科雜志”,在科研設(shè)計(jì)和統(tǒng)計(jì)分析方面的應(yīng)用現(xiàn)狀;胡良平等抽查了“中華耳鼻咽喉科雜志”1998 年到2000 年發(fā)表的部分文獻(xiàn),發(fā)現(xiàn)統(tǒng)計(jì)學(xué)誤用比較常見。因此本文將對醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)方法的正確應(yīng)用進(jìn)行討論,希望加強(qiáng)作者的統(tǒng)計(jì)思維,進(jìn)而提高期刊論文的統(tǒng)計(jì)質(zhì)量及學(xué)術(shù)水平。 1 統(tǒng)計(jì)學(xué)方法的內(nèi)容 統(tǒng)計(jì)軟件包、統(tǒng)計(jì)分析方法及檢驗(yàn)水準(zhǔn)是統(tǒng)計(jì)學(xué)方法必須描述的3方面內(nèi)容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界學(xué)術(shù)界公認(rèn)且最常用的兩大統(tǒng)計(jì)軟件包。檢驗(yàn)水準(zhǔn)即A,表示組間實(shí)際無差別而統(tǒng)計(jì)結(jié)果判斷為有差別,犯這類錯(cuò)誤的概率。實(shí)際工作中常取 A=0.05,表示本次研究計(jì)算所得P 值必須小于0.05,才能認(rèn)為組間差異有統(tǒng)計(jì)學(xué)意義。因而本刊對于檢驗(yàn)水準(zhǔn)的描述多簡化為“P值< 0. 05 為有統(tǒng)計(jì)學(xué)意義”。統(tǒng)計(jì)分析方法的準(zhǔn)確描述是科技論文科學(xué)性的關(guān)鍵所在。統(tǒng)計(jì)學(xué)方法一般包括統(tǒng)計(jì)描述和組間差異性檢驗(yàn)(即:假設(shè)檢驗(yàn)) 兩部分內(nèi)容。現(xiàn)詳細(xì)敘述如下: 2 統(tǒng)計(jì)描述 統(tǒng)計(jì)描述主要是根據(jù)資料類型及原始數(shù)據(jù)分布類型,選擇正確的指標(biāo)描述資料特征。資料類型分為定量資料和定性資料,前者是指對每個(gè)觀察對象測得的某個(gè)指標(biāo)能夠用具體數(shù)據(jù)表示,如:年齡、身高、每張切片的陽性細(xì)胞百分率等; 后者指對每個(gè)觀察對象測得的某個(gè)指標(biāo)不能用具體數(shù)值表示,僅反映觀察對象的某一特征,如: 陽性、陰性,ABO 血型,治愈、顯效、好轉(zhuǎn)、無效等。定量資料如果符合正態(tài)分布,統(tǒng)計(jì)描述指標(biāo)可用均數(shù)及標(biāo)準(zhǔn)差,一般描述為“數(shù)據(jù)以均數(shù)±標(biāo)準(zhǔn)差表示”; 如果不符合正態(tài)分布,則統(tǒng)計(jì)描述指標(biāo)選用中位數(shù)和級差(即: 最大值和最小值之差)。 區(qū)分資料是正態(tài)或偏態(tài)分布,可以通過SPSS、SAS 統(tǒng)計(jì)軟件程序判斷,也可以通過目測數(shù)據(jù)是否有"極端值",即特別大或特別小的數(shù)據(jù),進(jìn)行判斷。定性資料的統(tǒng)計(jì)描述包括率、構(gòu)成比及相對比。率表示單位時(shí)間內(nèi)某現(xiàn)象或事物發(fā)生的概率,如發(fā)病率、死亡率等;構(gòu)成比指事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,表示各構(gòu)成部分在全體中所占的比重或分布,不能說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,如性別構(gòu)成、疾病構(gòu)成、死亡構(gòu)成等。二者的區(qū)別從以下公式則一目了然。然而,在實(shí)際應(yīng)用中以構(gòu)成比代替率很常見。例如,某文分析240 例耳鼻咽喉科住院患者,鼻竇炎41 例,稱發(fā)病率17. 08% ,文中“發(fā)病率”實(shí)際為鼻竇炎患者在該科所有患者中的構(gòu)成比。此外,還有將病死率誤用為死亡率、患病率誤用為發(fā)病率等,這些都需引起作者的注意。某種疾病發(fā)病率= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)可能發(fā)生該種疾病的總?cè)藬?shù)某種疾病構(gòu)成比= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)發(fā)生各種疾病的總?cè)藬?shù)。 3 假設(shè)檢驗(yàn) 科技論文中最常用的是組間差異性檢驗(yàn)。假設(shè)檢驗(yàn)方法很多,不同的科研設(shè)計(jì)類型及資料類型適用的檢驗(yàn)方法有所不同。定量資料與定性資料常用的統(tǒng)計(jì)分析方法介紹如下。 3.1 定量資料 定量資料的統(tǒng)計(jì)分析方法包括參數(shù)法和非參數(shù)法,前者如t檢驗(yàn)、方差分析,后者如秩和檢驗(yàn)。選擇的關(guān)鍵在于資料分布類型,如果資料符合正態(tài)分布且組間方差齊(即各組標(biāo)準(zhǔn)差彼此接近) 則選用參數(shù)法,不符合則選用非參數(shù)法。但在許多醫(yī)學(xué)論文中經(jīng)常忽略這兩個(gè)條件,不考慮資料的分布直接采用t 檢驗(yàn)或方差分析,由此得出的分析結(jié)果是不可信的,見例1。 例1 為研究TGF- β、CEA 腫瘤標(biāo)志在喉癌患者手術(shù)前、后有無差異,分別檢測了58 名患者前及術(shù)后TGF- β和CEA,經(jīng)配對t 檢驗(yàn),TGF- β術(shù)前、后差異有統(tǒng)計(jì)學(xué)意義,結(jié)果見表1。表1.腫瘤標(biāo)記物術(shù)前術(shù)后的檢測* 組別 TGF- β(μg/l) CEA(μg/l)術(shù)前 19.0±26.3 34.0±79.0 術(shù)后 4.8±7.5* 20.6±11.2 與術(shù)前比較p值﹤0.05 表中兩指標(biāo)標(biāo)準(zhǔn)差均相差達(dá)2 倍以上,提示方差不齊,故不宜采用t 檢驗(yàn),而適合采用秩和檢驗(yàn)。t 檢驗(yàn)用于兩組均數(shù)間的比較,包括兩獨(dú)立樣本t 檢驗(yàn)、配對t 檢驗(yàn)和樣本均數(shù)與總體均數(shù)比較的t 檢驗(yàn);方差分析用于兩組或兩組以上均數(shù)的比較。然而,在許多醫(yī)學(xué)論文中,對于3 組或3 組以上均數(shù)的兩兩比較,常重復(fù)使用獨(dú)立樣本t 檢驗(yàn)作比較,如例2。這樣會(huì)加大犯陽性錯(cuò)誤的概率,即可能將無差別的兩個(gè)總體均數(shù)判斷為有差別。這點(diǎn)尤其需引起作者的注意,這也是醫(yī)學(xué)科技論文中t 檢驗(yàn)濫用的重要表現(xiàn)之一。此類資料正確的分析方法應(yīng)是先進(jìn)行方差分析,以確定這幾組均數(shù)總體差異有無統(tǒng)計(jì)學(xué)意義;如果有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步采用q 檢驗(yàn)(任意組間兩兩比較) 或Dunnett t 檢驗(yàn)(每個(gè)實(shí)驗(yàn)組與對照組比較) 以確定哪些組間差異有統(tǒng)計(jì)學(xué)意義。 例2 為了解不同分化程度的下咽癌患者VEGFR- 3 表達(dá)陽性脈管的數(shù)目VEGFR- 3 表達(dá)陽性脈管差異,分別檢測16 例高分化患者,1 5 例中分化者及13 例低分化者,作者采用獨(dú)立樣本t檢驗(yàn),結(jié)果見表2。表2 下咽癌組織中VEGFR- 3 表達(dá)陽性脈管與病理分級的關(guān)系組別 例數(shù) VEGFR- 3 表達(dá)陽性脈管高分化組 16 14.29±6.50 中分化組 15 15.65±5.84 低分化組 13 16.16±4.75 各組之間p 值﹥0.05 3.2 定性資料 定性資料整理與歸納后,主要分為3 種類型,即四格表資料(只有2 組,且結(jié)果變量為2 分類變量,總絡(luò)子數(shù)為4 見表3)、行×列表資料(總格子數(shù)> 4,見表4) 和列聯(lián)表資料(又稱雙向有序資料,見表5)。行×列表資料又包括單向有序資料(即等級資料,2 組或2 組以上,結(jié)果變量為有序多分類變量,見表6)。不同資料類型采用的統(tǒng)計(jì)分析方法有所不同。表3 四格表資料格式組別 陰性 陽性 合計(jì)實(shí)驗(yàn)組 10 29 39 對照組 24 11 35 合計(jì) 34 40 74 表4 行×列表資料格式組別 陰性 陽性 合計(jì)實(shí)驗(yàn)1 組 10 29 39 實(shí)驗(yàn)2 組 15 19 34 對照組 24 11 35 合計(jì) 49 59 108 表5 列聯(lián)表資料格式 N 分期 T 分期 N0 N1 N2 N3 合計(jì) T1 15 9 4 3 31 T2 13 14 9 4 40 T3 9 14 6 5 34 T4 8 7 7 4 26 合計(jì) 45 44 26 16 131 表6 單向有序資料格式組別 無效 好轉(zhuǎn) 顯效 治愈 合計(jì)實(shí)驗(yàn)組 3 9 11 19 42 對照組 9 5 7 9 30 合計(jì) 12 14 18 28 72 四格表資料χ2 檢驗(yàn)醫(yī)學(xué)論文中,四格表資料χ2 檢驗(yàn)的應(yīng)用很常見,但使用時(shí)應(yīng)注意具體的應(yīng)用條件。當(dāng)總例數(shù)大于40,且每個(gè)格子的理論頻數(shù)均不小于5 時(shí),應(yīng)用未校正的χ2 檢驗(yàn);如果總例數(shù)大于40,有一個(gè)格子的理論頻數(shù)小于5 但大于1,采用校正的χ2 檢驗(yàn); 如果總例數(shù)小于40,或有一個(gè)格子的理論頻數(shù)小于1,則采用Fisher 確切概率法。實(shí)際應(yīng)用中,許多作者不考慮應(yīng)用的前題條件,均使用未校正的χ2 檢驗(yàn),從而導(dǎo)致結(jié)果不可靠。行×列表資料χ2 檢驗(yàn)行×列表資料χ2 檢驗(yàn)主要用于多個(gè)率或構(gòu)成比的比較。但此時(shí)要求所有格子中理論頻數(shù)小于5 的格子數(shù)少于總格子數(shù)的1/5。如果大于1/5 ,則相鄰格子應(yīng)刪除或合并后再計(jì)算。此時(shí)若需了解具體那些率之間差異有統(tǒng)計(jì)學(xué)意義,就需進(jìn)行χ2 分割來確定。 單向有序資料此類資料如果是比較組間治療效果差異有無統(tǒng)計(jì)學(xué)意義,則應(yīng)采用秩和檢驗(yàn)。如果采用χ2 檢驗(yàn),僅表明各組的療效構(gòu)成差異有無統(tǒng)計(jì)學(xué)意義,因?yàn)榇藭r(shí)只利用了每組構(gòu)成比提供的信息,損失了有序指標(biāo)提供的“等級”信息。這也是許多作者誤用統(tǒng)計(jì)學(xué)方法的資料類型之一,需尤其注意。列聯(lián)表資料χ2 檢驗(yàn)此類資料特征為對同一組觀察對象,分別觀察其兩種有序分類變量的表現(xiàn),歸納成雙向交叉排列的統(tǒng)計(jì)表,分析兩個(gè)分類變量是否有相關(guān)聯(lián)系的假設(shè)檢驗(yàn),采用行×列表χ2 檢驗(yàn)。 3.3 相關(guān)性分析如果需了解兩變量有無相關(guān)性,或相關(guān)程度有多大,此時(shí)需作相關(guān)分析。相關(guān)分析應(yīng)報(bào)告相關(guān)系數(shù)及對該相關(guān)系數(shù)所作的假設(shè)檢驗(yàn)P 值。相關(guān)系數(shù)種類很多,選擇時(shí)應(yīng)根據(jù)指標(biāo)類型來確定。如果是計(jì)量指標(biāo),則應(yīng)選擇Pearson 相關(guān)系數(shù); 如果是等級指標(biāo),則應(yīng)選擇Spearman 相關(guān)系數(shù)。 3.4 結(jié)論的表述 首先要明確“P 值< 0.05”,習(xí)慣上稱“顯著”(significant) ,僅說明兩組差異有統(tǒng)計(jì)學(xué)意義,并不能說明兩組該指標(biāo)相差很大,或在專業(yè)上有顯著的(重要的)價(jià)值; 反之,P 值>0.05,習(xí)慣上稱“不顯著”(non significant) ,不應(yīng)誤解為相差不大,或一定相等,僅說明從統(tǒng)計(jì)角度考慮這兩組差異無統(tǒng)計(jì)學(xué)意義。為了不與一般意義上的“顯著”、“不顯著”相混淆,許多統(tǒng)計(jì)學(xué)家主張作結(jié)論時(shí)不用“是否顯著”一詞,而用“差異有無統(tǒng)計(jì)學(xué)意義”。此外,根據(jù)統(tǒng)計(jì)結(jié)果得出專業(yè)結(jié)論不能太絕對化,因?yàn)榻y(tǒng)計(jì)結(jié)論均是概率性的,不是絕對的肯定或否定,本次研究統(tǒng)計(jì)結(jié)果是陰性,如果增加樣本含量,組間差異可能就有統(tǒng)計(jì)學(xué)意義了。綜上所述,不同的統(tǒng)計(jì)分析方法均有其應(yīng)用條件和適用范圍,實(shí)際應(yīng)用時(shí),必須根據(jù)科研設(shè)計(jì)類型及變量類型選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法,同時(shí)注意檢查結(jié)果解釋和專業(yè)結(jié)論是否同時(shí)滿足專業(yè)和統(tǒng)計(jì)學(xué)要求。切忌將t 檢驗(yàn)、χ2 檢驗(yàn)視為分析資料的“萬能工具”,盲目套用,導(dǎo)致文章的科學(xué)性降低。
更多醫(yī)學(xué)論文發(fā)表及評審條件相關(guān)信息推薦:
2015-2016年中國科學(xué)引文數(shù)據(jù)庫CSCD期刊目錄專題
醫(yī)學(xué)全在線-論文頻道(m.payment-defi.com/lunwen/)第一時(shí)間整理發(fā)布全國各地醫(yī)學(xué)職稱評審公告、評審結(jié)果、論文評審條件、期刊目錄等通知。