一組調(diào)查或?qū)嶒灁?shù)據(jù),如果是計量資料可求得平均數(shù),標準差等統(tǒng)計指標,如果是計數(shù)資料則求百分率藉以概括說明這群觀察數(shù)據(jù)的特征,故稱特征值。由于樣本特征值是通過統(tǒng)計求得的,所以又稱為統(tǒng)計量以區(qū)別于總體特征值?傮w特征值一般稱為參數(shù)(總體量)。我們進行科研所要探索的是總體特征值即總體參數(shù),而我們得到的卻是樣本統(tǒng)計量,用樣本統(tǒng)計量估計或推論總體參數(shù)的過程叫參數(shù)估計。
本章第一節(jié)例6.1通過檢查110個健康成人的尿紫質(zhì)算得陽性率為10%,這是樣本率,可用它來估計總體率,說明健康成人的尿紫質(zhì)陽性率水平,這樣的估計叫“點估計”。但由于存在抽樣誤差,不同樣本(如再檢查110人)可能得到不同的估計值。因此我們常用“區(qū)間估計”總體率(或總體均數(shù))大概在那一個范圍內(nèi),這個范圍就叫可信區(qū)間。區(qū)間小的一端叫下限,大的一端叫上限。常用的有95%可信區(qū)www.med126.com間與99%可信區(qū)間。根據(jù)同一資料所作95%可信區(qū)間比99%可信區(qū)間窄些(上、下限較靠近),但估計錯誤的概率后者為1%,前者為5%,進行總體參數(shù)的區(qū)間估計時可根據(jù)研究目的與標準誤的大小選用95%、或99%。
為了說明常用的總體均數(shù)之區(qū)間估計法,我們不妨回顧一下上節(jié)所敘的t分布。
由求t的基本公式
我們看到X與μ的距離等于t(SX),又根據(jù)X集中分布在μ周圍的特點,若取t的5%
界即t0.05,,(或1%界)乘以SX作為X與μ的距離范圍,就可用式(6.6)或式(6.7)求
出區(qū)間來估計總體均數(shù)μ所在范圍,估錯的概率僅有5%或1%,因此稱95%或99%可信區(qū)間。下面用實例說明其求法。
95%可信區(qū)間 X-t0.05,νSX<μ<X+T0.05,ΝSX(6.6)
99%可信區(qū)間 X-t0.05,νSX<μ<X+T0.01,ΝSX(6.7)
例6.2 上面抽樣實驗中第1號樣本的均數(shù)為488.6,標準差為61.65,例數(shù)10,自由度ν=10-1=9,試求95%與99%可信區(qū)間。
1.求標準誤
95%可信區(qū)間 488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估計μ是在444.49~532.71區(qū)間內(nèi)
99%可信區(qū)間 488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估計μ是在425.22~551.98區(qū)間內(nèi)
這里兩個可信區(qū)間都包含μ=500在內(nèi),所以這次估計是估計對了。
抽樣實驗共抽了100個樣本,除1號樣本外其余99個樣本均數(shù)也對μ作了區(qū)間估計,這些95%可信區(qū)間列在表6.4中。我們看到,只有5個95%可信區(qū)間(右上角標有星號)不包含總體均數(shù)μ=500在內(nèi),它們是:
樣本號 | X | 95%可信區(qū)間 |
6 | 546.7 | 515.78~577.62 |
7 | 524.5 | 500.45~548.55 |
28 | 476.1 | 454.91~497.29 |
72 | 465.3 | 447.02~483.58 |
75 | 526.6 | 503.10~550.10 |
平時我們并不重復抽取許多樣本來一次次估計總體均數(shù)而僅是一次,至于算出的均數(shù)會類似一百個樣本均數(shù)中的那一個就很難說了。如果不遇到類似上列那些均數(shù)過大或過小的樣本,求出可信區(qū)間后總體均數(shù)真是在該區(qū)間內(nèi),那么便是一次成功的估計:但是極少數(shù)情況下我們也會遇到極端的樣本,以至總體均數(shù)并不在我們提出的區(qū)間內(nèi)。不過,我們具體所作的這次估計到底屬于前種情況還是后一種,這是無法知道的,因為我們不知道μ是多少(若已知μ便不必估計它了)。然而象后種情況那樣作出錯估的概率終究很小,只5%或1%,所以用這樣的方法估計總體均數(shù)還是可行的。
上面已經(jīng)提到,計數(shù)資料可以計算相對數(shù)(率)。我們?nèi)粲蓸颖窘y(tǒng)計量P估計總體參數(shù)π,同樣要考慮率的抽樣誤差,據(jù)數(shù)理統(tǒng)計研究結(jié)果,樣本率的分布也近似正態(tài)分布,尤其當π比較靠近50%且樣本較大時。于是對樣本,百分率的可信區(qū)間可利用正態(tài)分布規(guī)律估計,公式是:
95%可信區(qū)間 P-1.96Sp<π
99%可信區(qū)間 P-2.58Sp<π
(按正態(tài)分布,雙側(cè)尾部面積α=0.05時的u值為1.96,α=0.01時的u值為2.58,故用這兩式求可信區(qū)間時不必查表找臨界u值,記住這兩數(shù)即可。)
例6.3 某醫(yī)院收治200例急性菌痢患者,其中糞便細菌培養(yǎng)陽性者共80例,試估計菌痢細菌培養(yǎng)的總體陽性率95%與99%可信區(qū)間。
1.求陽性率 P=80/200×100%=40% (或0.40)
www.med126.com3.求可信區(qū)間
95%可信區(qū)間 40%-1.96(3.46%)<π<40%+1.96(3.46%),即估計π在33.22%~46.78%之間
99%可信區(qū)間 40%-2.58(3.46%)<π<40%+2.58(3.46%),即估計π在31.07%~48.93%之間
如果是小樣本的百分率,求可信區(qū)間可通過查表獲得,附表4是n為10、15、20、30時查95%與99%可信區(qū)間的一個簡表。此外,統(tǒng)計學專著中還有更詳細的表可查。