前面已提及,醫(yī)學研究中實際觀測或調查的一部分個體稱為樣本,研究對象的全部稱為總體。如作水質檢驗時從井水或河水中采的水樣,臨床化驗中從病人身上采的血液或其它活體組織標本,是樣本;而整個一口井或一條河的某一段所有的水,某病人全身所有的血液或某個組織器官,則是總體。這類總體是具體存在的,但另有些總體卻是假想的,只是理論上存在的一個范圍。例如試驗某一治療流感新藥的療效,最初接受治療的一批流感患者,不論數量多少,都只是一個樣本。若該藥療效得到肯定,從而加以推廣,那么此后凡在相同條件下接受該藥治療的所有流感患者,都屬于這個總體。可是當初試用時,這個總體還并不存在,是假想的。
總體包含的觀察單位通常是大量的甚至是無限的,在實際工作中,一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調查研究,根據對這一部分觀察單位的觀察研究結果,再去推論和估計總體情況。如上述某新藥治療流感例子,試驗治療的只是少數有限的病人,而結論卻要推廣到全體,得出一個該藥對所有流感患者之療效的規(guī)律性的認識。所以說,觀察樣本的目的在于推論總體,這就是樣本與總體的辯證關系。
為了使樣本能夠正確反映總體情況,對總體要有明確的規(guī)定;總體內所有觀察單位必須是同質的;在抽取樣本的過程中,必須遵守隨機化原則;樣本的觀察單位還要有足夠的數量。
又稱機率,是用以描述某事件發(fā)生的可能性大小的一個數值。
在自然界和人類社會中,存在著兩類不同的現象:①在一定條件下,肯定發(fā)生的事件叫做必然事件,肯定不發(fā)生的事件叫做不可能事件。如在適當溫度濕度下經一定時間孵化,正常受精雞蛋必然會孵出小雞來,而石頭是不可能孵出小雞來的。必然事件與不可能事件雖然形式相反,但兩者在發(fā)生某種結果與否都是確定的,故統(tǒng)稱確定性現象。②在基本條件不變的情況下,可能發(fā)生的結果有多種,究竟發(fā)生哪種結果,事先不能肯定,這類現象叫做隨機現象。隨機現象的表現結果稱為隨機事件。如任意拋擲一枚硬幣,可能徽花向上也可能幣值向上,拋擲前不能肯定,這是一個隨機現象,而結果出現“徵花向上”則是一個隨機事件。
(一)古典概率 是m.payment-defi.com/shiti/最簡單的隨機現象的概率計算。這類隨機現象具有兩個特征:①在觀察或試驗中它的全部可能結果只有有限個,譬如為n個,記為E1,E2,…,En,而且這些事件是兩兩互不相容的,即任何兩個事件不能同時發(fā)生;②事件E1,E2,…,En的發(fā)生或出現是等可能的,即它們發(fā)生的概率都一樣。古典概率的大部分問題都能形象地用摸球模型來描述。有利于直觀地理解概率論的許多基本概念;而且它有著多方面的重要應用,例如工業(yè)產品的抽樣檢查等。
(二)統(tǒng)計概率 上述“事件”是指不能再進行分解或不能由其它事件構成的基本事件。在實際工作中,基本事件的發(fā)生并不總是等可能的,而且有時為無窮多個。這樣就有必要把古典概率的定義加以推廣,從事后經驗的角度來理解概率的意義。實踐證明,雖然個別隨機事件在某次試驗或觀察中可以出現也可以不出現,但在大量重復試驗中它卻呈現出明顯的規(guī)律性。假設在相同條件下,獨立地重復做n次試驗,某隨機事件A在n次試驗中出現了m次,則比值m/n稱為隨機事件A在n次試驗中出現的頻率。當試驗重復很多次時,隨機事件A的頻率m/n就會在某個固定的常數P附近擺動,而且n愈大擺動的幅度愈小。這種規(guī)律性稱之為統(tǒng)計規(guī)律性。頻率的穩(wěn)定性說明隨機事件發(fā)生的可能性大小是隨機事件本身固有的、不隨人們意志為轉移的客觀屬性,所以在醫(yī)學科研中,當n充分大時,就以頻率作為概率的近似值,記住P(A)即
由此可見,頻率是就樣本而言的,而概率總是從總體的意義上說的。這樣,概率就為預計某一事件發(fā)生的可能性大小,提供了衡量的尺度。
例如:某病患者40名,用某療法治療后,其中35人痊愈,治愈者占治療人數的35/40,這是頻率。因為數量少,這個頻率可能波動較大。假如經過長期的大量觀察,比如數百、數千例,得到治愈率為70%,我們就可以說,該療法治愈某病的概率近似值為70%。
又如:某院婦產科在一個月內出生嬰兒30名,其中男嬰18名,占新生兒數的18/30,這叫頻率。大量統(tǒng)計表明,人口中男女的比例基本上是1:1。這是個較穩(wěn)定的常數,即概率的近似值。于是,在嬰兒分娩前,我們就可用它作為尺度,預計是男的概率為1/2(0.5或50%),是女的概率也為1/2(0.5或50%)。
通過以上討論,可以知道:如果某事件是必然事件,則有m=n,所以必然事件的概率等于1;如果某事件是不可能事件,則有m=0,所以不可能事件的概率等于0;如果某事件是隨機事件,則有0<M<N,所以隨機事件的概率是介于0與1之間的一個數。某事件的概率愈接近0,表示發(fā)生的可能性愈小;愈接受1,表示發(fā)生的可能性愈大。
簡單地說,是指隨機事件的數量表現。例如一批注入某種毒物的動物,在一定時間內死亡的只數;某地若干名男性健康成人中,每人血紅蛋白量的測定值;等等。另有一些現象并不直接表現為數量,例如人口的男女性別、試驗結果的陽性或陰性等,但我們可以規(guī)定男性為1,女性為0,則非數量標志也可以用數量來表示。這些例子中所提到的量,盡管它們的具體內容是各式各樣的,但從數學觀點來看,它們表現了同一種情況,這就是每個變量都可以隨機地取得不同的數值,而在進行試驗或測量之前,我們要預言這個變量將取得某個確定的數值是不可能的。
按照隨機變量可能取得的值,可以把它們分為兩種基本類型:①離散型隨機變量,即在一定區(qū)間內變量取值為有限個,或數值可以一一列舉出來。例如某地區(qū)某年人口的出生數、死亡數,某藥治療某病病人的有效數、無效數等。②連續(xù)型隨機變量,即在一定區(qū)間內變量取值有無限人,或數值無法一一列舉出來。例如某地區(qū)男性健康成人的身長值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值等。
誤差是指實際觀察值與客觀真值之差、樣本指標與總體指標之差。誤差可分為系統(tǒng)誤差和隨機誤差。
(一)系統(tǒng)誤差 在實際觀測過程中,由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值兩側,而是有方向性、系統(tǒng)性或周期性地偏離真值。這類誤差可以通過實驗設計和技術措施來消除或使之減弱,但不能靠概率統(tǒng)計辦法來消除或減弱。
(二)隨機誤差 或稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機地變化。隨機誤差服從正態(tài)分布,可以用概率統(tǒng)計方法處理。
在隨機誤差中,最重要的是抽樣誤差。我們從同一總體中隨機抽取若干個大小相同的樣本,各樣本平均數(或率)之間會有所不同。這些樣本間的差異,同時反映了樣本與總體間的差異。它是由于從總體中抽取樣本才出現的誤差,統(tǒng)計上稱為抽樣誤差(或抽樣波動)。抽樣誤差在醫(yī)學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規(guī)律的。研究和運用抽樣誤差的規(guī)律,是根據樣本估計總體時所必須領會的基本概念之一,也是醫(yī)學統(tǒng)計學的重要內容之一。
隨機誤差中還包括重復誤差。它是由于對同一受試對象或檢樣采用同一方法重復測定時所出現的誤差。如用天平稱同一個燒杯的重量,重復測定多次,其結果會有某些波動?刂浦貜驼`差的手段主要是改進測定方法,提高操作者的熟練程度。重復是摸清實驗誤差大小的手段,以便分析和減少實驗誤差。
亦稱顯著性檢驗,其基本原理是先對總體的特征作出某種假設,然后通過抽樣研究的統(tǒng)計推理,對此假設應該被拒絕還是接受作出推斷。
生物現象的個體差異是客觀存在,以致抽樣誤差不可避免,所以我們不能僅憑個別樣本的值來下結論。當遇到兩個或幾個樣本均數(或率)、樣本均數(率)與已知總體均數(率)有大有小時,應當考慮到造成這種差別的原因有兩種可能:一是這兩個或幾個樣本均數(或率)來自同一總體,其差別僅僅由于抽樣誤差即偶然性所造成;二是這兩個或幾個樣本均數(或率)來自不同的總體,即其差別不僅由抽樣誤差造成,而主要是由實驗因素不同所引起的。假設檢驗的目的就在于排除抽樣誤差的影響,區(qū)分差別在統(tǒng)計上m.payment-defi.com/wsj/是否成立,并了解事件發(fā)生的概率。
進行假設檢驗時,要先建立檢驗假設(即上述第一種可能,符號是H0)與備擇假設(即上述第二種可能,符號是H1),確立檢驗水準(當檢驗假設為真,但被錯誤地拒絕的概率,記作α),通常取α=0.05或α=0.01;然后由樣本觀察值按相應的公式計算統(tǒng)計量,如X2值、t值等;最后查有關的統(tǒng)計用表確定P值范圍(有時也可直接計算P值)作出結論。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統(tǒng)計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統(tǒng)計上成立。