設(shè)有甲乙兩人,對(duì)同一名患者采耳垂血,檢查紅細(xì)胞數(shù)(萬(wàn)/mm3),每人數(shù)五個(gè)計(jì)數(shù)盤(pán),得結(jié)果為
合計(jì) | 均數(shù) | ||||||
甲 | 480 | 490 | 500 | 510 | 520 | 2500 | 500 |
乙 | 440 | 460 | 500 | 540 | 560 | 2500 | 500 |
兩人計(jì)數(shù)的均數(shù)都是500,能說(shuō)兩人的檢驗(yàn)技術(shù)相同嗎?不能,因?yàn)榧椎挠?jì)數(shù)結(jié)果比較密集,而乙的分散,因此甲的檢驗(yàn)精度顯然比乙的高。從上可以看出:描述一群變量值,除用平均數(shù)等表示其集中位置外,還要說(shuō)明其分散或變異情況。說(shuō)明變異情況的特征值稱變異指標(biāo)。變異指標(biāo)的種類(lèi)較多,下面分別介紹極差、四分位數(shù)間距、均差、方差、標(biāo)準(zhǔn)差及變異系數(shù)。
1.極差 最大值與最小值之差稱極差(或全距),符號(hào)為R,是變異指標(biāo)中最簡(jiǎn)單的一種。如上例甲計(jì)數(shù)的極差為520-480=40,乙的為560-440=120?梢(jiàn)乙的計(jì)數(shù)較甲的波動(dòng)大。一般把最小值與最大值寫(xiě)在括號(hào)里,附在極差的后面。如上例寫(xiě)成40(480~520)與120(440~560)。其單位與變量值的相同。
當(dāng)調(diào)查例數(shù)增多時(shí),遇到較大或較小極端值的機(jī)會(huì)就加大,因此最大值與極差隨著例數(shù)的增多而加大,但最小值卻隨著例數(shù)的增多而變小。
極差計(jì)算簡(jiǎn)便,但只考慮了最小、最大值,因此易受個(gè)別極端值的影響,且隨例數(shù)的多少而變動(dòng),不穩(wěn)定。僅用于粗略地說(shuō)明變量值的變動(dòng)范圍。但在正態(tài)分布中可用以估計(jì)標(biāo)準(zhǔn)值范圍,詳見(jiàn)有關(guān)文獻(xiàn)。
2.四分位數(shù)間距 極差的不穩(wěn)定主要是受兩極端數(shù)值的影響,于是有人將兩端數(shù)據(jù)按比例去掉一定例數(shù),這樣所得數(shù)據(jù)就比較穩(wěn)定了。例如兩端各去掉25%,取中間50%數(shù)據(jù)的數(shù)值范圍,那么只要計(jì)算P25與P75,求P75與P25之差即得四分位數(shù)間距,符號(hào)為Q。
Q=P75-P25 (4.12)
例4.7 試計(jì)算表4.8七歲男童坐高的四分位數(shù)間距
求 P25的位置102×.25=.25.5.
求 P75的位置102×.75=.76.5.
求累計(jì)頻數(shù)得:
L25=65,L75=68,
A25=22,A75=75,
f25=15, f75=13,i=1
表4.8 7歲男童的坐高
坐高(cm) | 例數(shù)(f) | 累計(jì)頻數(shù) |
61- | 1 | 1 |
62- | 3 | 4 |
63- | 4 | 8 |
64- | 14 | 22 |
65- | 15 | 37 |
66- | 21 | 58 |
67- | 17 | 75 |
68- | 13 | 88 |
69- | 7 | 95 |
70- | 5 | 100 |
71- | 2 | 102 |
合計(jì) | 102 | — |
代入式(4.5)得:
Q=68.12-65.23=2.89 cm
有50%的7歲男童,坐高在65.23~68.12cm之間,其四分位數(shù)間距為2.89cm。
3.均差 四分位數(shù)間距雖比極差穩(wěn)定,但仍只是兩點(diǎn)之間的距離,沒(méi)有利用每個(gè)變量值的信息。于是有人計(jì)算每個(gè)變量值與均數(shù)(或中位數(shù))差的絕對(duì)值之和,然后平均稱為均差(或平均直線差)作為變異指標(biāo)之一。
(4.13)
例4.8 試計(jì)算4.3中,心重的均差。
由例4.3知X=293.75g,代入式(4.13)得
4.方差 式式(4.13)中用變量值與均數(shù)之差的絕對(duì)值之和∑∣X-X∣,而不用離均差之和∑(X-X)是因?yàn)椤疲╔-X)=0,不能說(shuō)明變異情況,故取絕對(duì)值以去掉負(fù)號(hào)。亦有人用平方的辦法,即用離均差平方和∑(X-x )2,既去掉了負(fù)號(hào),又提高了指標(biāo)的靈敏性。因?yàn)閿?shù)值愈大,平方后增大的愈多,所以離均差稍有變化,就能從指標(biāo)上反映出來(lái)。例如有甲乙兩組數(shù)據(jù)如下:
X | ∑∣X-X∣ | ∑(X-X)2 | ||||||
甲組 | 10 | 11 | 12 | 13 | 14 | 12 | 6 | 10 |
乙組 | 9 | 12 | 12 | 13 | 14 | 12 | 6 | 14 |
乙組僅有兩個(gè)數(shù)據(jù)與甲組的不同,這種不同從∑∣X-X∣或均差上是反映不出來(lái)的,但從∑(X-X)2上卻反映出來(lái)了。以∑(X-X)2組成的變異指標(biāo)有方差與標(biāo)準(zhǔn)差。方差是標(biāo)準(zhǔn)差的平方,將在第八章討論,下面先介紹標(biāo)準(zhǔn)差。
1.標(biāo)準(zhǔn)差的公式 樣本標(biāo)準(zhǔn)差是用得最多的變異指標(biāo),其公式為
(4.14)
式(4.14)中的n-1是自由度。n個(gè)變量值本有n個(gè)自由度,但計(jì)算標(biāo)準(zhǔn)差時(shí)用了樣本均數(shù)X,因此就受到了一個(gè)條件即∑X= nX的限制。例如有4個(gè)數(shù)據(jù),它們的均數(shù)為5。由于受到均數(shù)為5的限制,4個(gè)數(shù)據(jù)中只有3個(gè)可以任意指定。如果任意指定的是4、3、6,那么第4個(gè)數(shù)據(jù)只能是7,否則均數(shù)就不是5了。所以標(biāo)準(zhǔn)差的自由度為n-1。
2.標(biāo)準(zhǔn)差的計(jì)算
(1)按基本公式(4.14)計(jì)算
例4.9 用例4.3資料計(jì)算心重的標(biāo)準(zhǔn)差。
已算得X=293.75g,代入式(4.14)得
(2)遞推法當(dāng)用電子計(jì)算機(jī)進(jìn)行計(jì)算,希望每輸入一個(gè)數(shù)據(jù),都能得到X與S,則將式(4.8)與式
(4.5)配合計(jì)算。
(4.15)
這里Sn表示n個(gè)數(shù)據(jù)的標(biāo)準(zhǔn)差,Sn-1表示n-1個(gè)數(shù)據(jù)的標(biāo)準(zhǔn)差。Xn是第n個(gè)數(shù)據(jù),Xn-1是n-1個(gè)數(shù)據(jù)的均數(shù)。
例4.10 仍用例4.3資料,已算得前19例心重的X19=292.37,S19=38.71。X20=320,代入式(4.15)得
(3)直接法 不需先計(jì)算均數(shù),直接用變量值代入式(4.16)或式(1.17)計(jì)算。
(4.16)
或
(4.17)
式(4.16)的分子是由式(4.14)的分子簡(jiǎn)化而得來(lái)的,證明如下。
例4.11用ELISA(酶聯(lián)免疫吸附測(cè)定)法檢測(cè)vero-E6,細(xì)胞培養(yǎng)上清正常標(biāo)本10份的結(jié)果(100XOD490值)為m.payment-defi.com/yishi/2,3,3,4,4,5,5,5,6,8,求標(biāo)準(zhǔn)差。
若用式(4.16)則先計(jì)算
∑X=2+3+3+…+6+8=45
∑X2=22+32+32+…62+82=229
若用式(4.17)則先計(jì)算
∑fX=1×2+2×3+…+1×6+1×8=45
∑fX2=1×22+2×32+…1×62+1×82=229
然后代入式(4.16)或式(1.17)結(jié)果相同。
上述各種變異指標(biāo)可用來(lái)比較同類(lèi)事物變量值間的變異情況。各變異指標(biāo)的共同點(diǎn)是:值小表示變量值密集,值大表示變量值分散。但在有些情況下用標(biāo)準(zhǔn)差等變異指標(biāo)來(lái)比較就不適宜了。如某地7歲男童身高均數(shù)為123.10cm ,標(biāo)準(zhǔn)差為4.71cm;體重的均數(shù)為22.29kg,標(biāo)準(zhǔn)差為2.26kg。由于單位不同,我們不能因?yàn)?.71>2.26而說(shuō)身高的變異大于體重,需要有另一個(gè)指標(biāo),它不受單位的限制,那就是變異系數(shù),其公式為:
CV=S/X×100%,X>0 。4.18)
也就是將標(biāo)準(zhǔn)差化為各自均數(shù)的百分?jǐn)?shù),然后比較。這樣不但可以比較單位不同的變量值間的變異,而且可以比較均數(shù)相差懸殊的變量值間的變異。
上述7歲男童身高、體重的變異系數(shù)分別為
身高CV=4.17/123.10×100%=3.83%
體重CV=2.26/22.29×100%=10.14%
可見(jiàn)同一批兒童的體重變異比身高的大。
例4.12被試者9人,試驗(yàn)時(shí)坐在舒適的牙科椅上測(cè)口腔壓力波幅PcmAq(厘米水柱)。然后外加呼吸阻力20cmAq(1/sec),5分鐘時(shí)再測(cè)口腔壓力波幅結(jié)果如下。試比較外加呼吸阻力前后,m.payment-defi.com/kuaiji/口腔壓力波幅的變異。
表4.9 外加呼吸阻力前后的口腔壓力波幅
口腔壓力波幅,cmAg
口腔壓力波幅,cmAg | |||
X | S | CV(%) | |
加阻力前 | 1.218 | 0.256 | 21.019 |
加阻力后 | 7.240 | 0.633 | 8.741 |
外阻力前口腔壓力波幅的變異較大。
外加呼吸阻力前后的口腔壓力波幅的單位都是cmAq,如直接比較兩個(gè)標(biāo)準(zhǔn)差,可能會(huì)得出加阻力后數(shù)值變異較大的結(jié)論。但由于兩均數(shù)相差懸殊,加阻力后的均數(shù)幾乎是加阻力前的6倍,因此就不宜直接比較標(biāo)準(zhǔn)差而應(yīng)比較它們的變異系數(shù)。
變異系數(shù)還常用于比較多個(gè)樣品重復(fù)測(cè)定的誤差等。
運(yùn)用變異系數(shù)時(shí)應(yīng)注意(1)有關(guān)的事物間才能作比較,不要將風(fēng)馬牛不相及的東西硬拉在一起作比較;(2)均數(shù)小于標(biāo)準(zhǔn)差時(shí)應(yīng)考慮其實(shí)際運(yùn)用價(jià)值。因?yàn)樵谶@種情況下,可能誇大變異,故不宜使用;(3)比較兩變異系數(shù)間是否真有差別,亦應(yīng)作假設(shè)檢驗(yàn),不能只看表面值就下結(jié)論。
[附]比較兩變異系數(shù)可用u檢驗(yàn),其公式為
式中V為以小數(shù)表示的變異系數(shù),SV2是變異系數(shù)的標(biāo)準(zhǔn)誤的平方,n是樣本含量。u是正態(tài)離差系數(shù)。
例4.13比較例4.12中兩總體變異系數(shù)間有無(wú)差別。
H0:兩總體變異系數(shù)相等
H1:兩總體變異系數(shù)不等
α=0.05
u>u0.05,0.05>P>0.01,在α=0.05的水準(zhǔn)處拒絕H0,接受H1,兩總體變異系數(shù)不等。外加呼吸阻力前的口腔壓力波幅的變異較大。
1.變異指標(biāo)表示變量值的變異情況或離中趨勢(shì),常與位置指標(biāo)平均數(shù)結(jié)合運(yùn)用,說(shuō)明變量值集中的位置與離散程度。
2.變異指標(biāo)種類(lèi)雖多,但任一變異指標(biāo),其值大表示變異大,數(shù)值參差甚;值小表示變異小,數(shù)值較集中。比較兩個(gè)或幾個(gè)同類(lèi)事物的變異,要用同一變異指標(biāo)。
3.正態(tài)分布資料宜用均數(shù)與標(biāo)準(zhǔn)差(有時(shí)用方差)描述集中與離散情況,記為X±S。有了均數(shù)與標(biāo)準(zhǔn)差就可根據(jù)正態(tài)分布理論將頻數(shù)分布描繪出來(lái),進(jìn)一步可作正常值范圍估計(jì)與假設(shè)檢驗(yàn)等(詳見(jiàn)第五至第七章),應(yīng)用較廣。為便于計(jì)算,正態(tài)分布資料亦可用中位數(shù)、百分位數(shù)和四分位數(shù)間距等描述,其結(jié)果與用均數(shù)、標(biāo)準(zhǔn)差相近。
偏態(tài)分布資料宜用中位數(shù)及四分位數(shù)間距、均差等描述。尤其在資料分布呈明顯偏態(tài)時(shí),隨著例數(shù)的增多,中位數(shù)、四分位數(shù)間距及均差的代表性和穩(wěn)定性明顯優(yōu)于均數(shù)、標(biāo)準(zhǔn)差及方差。
眾數(shù)和極差只用來(lái)對(duì)單峰資料作概括的描述。
4. 比較幾組資料的變異程度,若各組資料的單位不全相同,或均數(shù)相差懸殊時(shí),用變異系數(shù)。
5.判斷幾個(gè)方差或變異系數(shù)間有無(wú)顯著差別,需作假設(shè)檢驗(yàn),不能只看表面值。詳見(jiàn)第七、第八章有關(guān)內(nèi)容。