第三章誤差及分析數據處理
第一節(jié) 分析化學中的誤差概念
一、誤差-(Error)測量值(X)與真值(μ)之間的差值(E)。
二、誤差的來源(Sources of error)
(1)系統(tǒng)誤差(systematic error)由固定的原因造成的,使測定結果系統(tǒng)偏高或偏低,重復出現,其大小可測,具有“單向性”,可用校正法消除。
根據其產生的原因分為以下4種。
*方法誤差(method error):分析方法本身不完善而引起的。
* 儀器和試劑誤差(instrumentand reagent error):儀器本身不夠精確,試劑不純引起誤差。
*操作誤差(operational error):分析人員操作與正確操作差別引起的。
*主觀誤差(Personal error):分析人員本身主觀因素引起的
系統(tǒng)誤差特點i 重現性;ii 單向性;iii 恒定性。通常加校正值的方法消除系統(tǒng)誤差。
(2)隨機誤差(random error,accidental error,indeterminate error)由一些隨機偶然原因造成的、可變的、無法避免,符合“正態(tài)分布”。
(3)過失誤差,顯著誤差(Grossmistake)由于分析人員不小心引起,例如操作錯誤、運算和記錄錯誤。
三、準確度與精密度
準確度與誤差
1.準確度(accuracy) 測量值與真實值的接近程度,用絕對誤差或相對誤差表示。
(1)絕對誤差:( Absolute error,AE) 絕對誤差表示測量值(X)與真值(μ)的差。
AE=X-μ
(2) 相對誤差(Relative error, RE)
RE% = AE / μ× 100%
例:用分析天平稱樣,一份0.2000克,一份0.0020克,稱量的絕對誤差均為+0.0002克,問兩次稱量的RE%?
解:第一份試樣
RE1%=+0.0002÷0.2000×100%=+0.1%
第二份試樣
RE2%=+0.0002÷0.0020×100%=+10%
由此可以看出,絕對誤差一樣的情況下,物質的質量越大,其稱量的相對誤差就越小,即準確度就越高。
精密度和偏差
精密度(Precision)用相同的方法對同一個試樣平行測定多次,得到結果的相互接近程度。以偏差來衡量其好壞。
重復性(Repeatability)同一分析人員在同一條件下所得分析結果的精密度。
再現性(Reproducibility)不同分析人員或不同實驗室之間各自的條件下所得分析結果得精密度。
偏差(Deviation) 一組是表示個別測量值與平均值之間的差值,一組分析結果的精密度可以用平均偏差和標準偏差兩種方法來表示。
絕對偏差(Absolutedeviation)
相對偏差(Relativedeviation)
di 和RD 只能衡量每個測量值與平均值的偏離程度
平均偏差:為各次測定值的偏差的絕對值的平均值,
式中n為測量次數。由于各測量值的絕對偏差有正有負,取平均值時會相互抵消。只有取偏差的絕對值的平均值才能正確反映一組重復測定值間的符合程度。
相對平均偏差:為平均偏差與平均值之比,常用百分率表示:
標準偏差(standard deviation; S)
使用標準偏差是為了突出較大偏差的影響。
相對標準偏差(RSD)或稱變異系數,實際工作中都用RSD表示分析結果的精密度。
平均值的標準偏差:
設有一樣品,m個分析工作者對其進行分析,每人測 n 次,計算出各自的平均值,這些平均值的分布也是符合正態(tài)分布的。
對有限次測量:
結論:
1、增加測量次數可以提高精密度。
2、增加(過多)測量次數的代價不一定能從減小誤差得到補償。
三、準確度與精密度的關系
例:A、B、C、D 四個分析工作者對同一鐵標樣中的鐵含量進行測量,得結果如圖示,比較其準確度與精密度。
1、準確度反應的是測定值與真實值的符合程度。
2、精密度反應的則是測定值與平均值的偏離程度;
3、精密度高是準確度高的前提,但精密度高,準確度不一定高。
四、隨機誤差的統(tǒng)計概念
(一)、誤差的統(tǒng)計概念
2、隨機誤差的正態(tài)分布:測量數據一般符合正態(tài)分布規(guī)律,即高斯分布,正態(tài)分布曲線數學表達式為:
y:概率密度;x:測量值。
μ:總體平均值,即無限次測定數據的平均值,無系統(tǒng)誤差時即為真值;反映測量值分布的集中趨勢。
σ:標準偏差,反映測量值分布的分散程度;
x-μ:隨機誤差
3、正態(tài)分布曲線規(guī)律:
* x=μ 時,y值最大,體現了測量值的集中趨勢。大多數測量值集中在算術平均值的附近,算術平均值是最可信賴值,能很好反映測量值的集中趨勢。μ反映測量值分布集中趨勢。
* 曲線以x=μ這一直線為其對稱軸,說明正誤差和負誤差出現的概率相等。
* 當x趨于-∞或+∞時,曲線以x軸為漸近線。即小誤差出現概率大,大誤差出現概率小,出現很大誤差概率極小,趨于零。
*σ越大,測量值落在μ附近的概率越小。即精密度越差時,測量值的分布就越分散,正態(tài)分布曲線也就越平坦。反之,σ越小,測量值的分散程度就越小,正態(tài)分布曲線也就越尖銳。σ反映測量值分布分散程度。
4、標準正態(tài)分布曲線
橫坐標改為u,縱坐標為概率密度,此時曲線的形狀與σ大小無關,不同σ的曲線合為一條。
5、隨機誤差的區(qū)間概率
正態(tài)分布曲線與橫坐標-∞到+∞之間所夾的面積,代表所有數據出現概率的總和,其值應為1,即概率P為:
隨機誤差出現的區(qū)間測量值出現的區(qū)間 概率(以σ為單位)
u=±1 x=μ±1σ 68.3%
u=±1.96 x=μ±1.96σ 95.0%
u=±2 x=μ±2σ 95.5%
u=±2.58 x=μ±2.58σ 99.0%
u=±3&nbs醫(yī)學招聘網p; x=μ±3σ99.7%
(二)、少量數據的統(tǒng)計處理
1 t 分布曲線
正態(tài)分布是無限次測量數據的分布規(guī)律,而對有限次測量數據則用t 分布曲線處理。用s代替σ,縱坐標仍為概率密度,但橫坐標則為統(tǒng)計量t。
t定義為:
自由度f — degree of freedom ( f = n-1)
t分布曲線與正態(tài)分布曲線相似,只是t分布曲線隨自由度f而改變。當f趨近∞時,t分布就趨近正態(tài)分布。
置信度(P)confidencedegree在某一t值時,測定值落在(μ+ts)范圍內的概率。
置信水平(α)confidence level在某一t值時,測定值落在(μ+ts)范圍以外的概率(l-P)。
ta,f :t值與置信度P及自由度f關系。
例: t0·05,10表示置信度為95%,自由度為10時的t值。
t0·01,5表示置信度為99%,自由度為5時的t值。
2 平均值的置信區(qū)間(confidence interval)
當n趨近∞時:單次測量結果:
以樣本平均值來估計總體平均值可能存在的區(qū)間:
對醫(yī)學.全在線m.payment-defi.com于少量測量數據,即當n有限時,必須根據t分布進行統(tǒng)計處理:
它表示在一定置信度下,以平均值為中心,包括總體平均值的范圍。這就叫平均值的置信區(qū)間。
第二節(jié) 分析數據的處理
一、有效數字及其運算規(guī)則
1、有效數字(significant figure)
分析工作中實際上實際能測到的數字。在有效數字中,只有最后一位數是不確定的,可疑的。有效數字位數由儀器準確度決定,它直接影響測定的相對誤差。
2、位數確定
(1) 記錄測量數據時,只允許保留一位可疑數字。
(2) 有效數字的位數反映了測量的相對誤差,不能隨意舍去最后一位數字。
(3) 數據中的“0”作具體分析,如1.2007g, 0.0012007kg均為五位有效數值,
(4) 常數π等非測量所得數據,視為無限多位有效數字;
(5) pH、pM等對數值,有效數字位數僅取決于小數部分數字的位數。如pH=10.20,應為兩位有效數值
看看下面各數的有效數字的位數:
1.0008 43181 五位有效數字
0.1000 10.98% 四位有效數字
0.0382 1.98×10-10 三位有效數字
54 0.0040 二位有效數字
0.05 2×105 一位有效數字
3600100 位數模糊
PH=11.20對應于[H+]=6.3×10-12 二位有效數字
3、有效數字的計算規(guī)則
(1) 數值相加減時,結果保留小數點后位數應與小數點后位數最少者相同
(絕對誤差最大)
0.0121+12.56+7.8432=0.01+12.56+7.84=20.41
總絕對誤差取決于絕對誤差大的
(2) 數值相乘除時,結果保留位數應與有效數字位數最少者相同。(相對誤差最大),
(0.0142×24.43×305.84)/28.7=(0.0142×24.4×306)/28.7=3.69
總相對誤差取決于相對誤差大的。
(3) 乘方或開方時,結果有效數字位數不變。
如 ,
(4) 對數運算時,對數尾數的位數應與真數有效數字位數相同;
如
尾數0.20與真數(6.3)都為二位有效數字,而不是四位有效數字。
4、數字修約規(guī)則
(1)四舍六入五成雙。如測量值為4.135、4.125、4.105、4.1251;修約為4.14、4.12、4.10和4.13。
(2)只允許對原測量值一次修約至所需位數,不能分次修約。如4.1349修約為三位數。不能先修約成4.135,再修約為4.14,只能修約成4.13。
(3) 大量數據運算時,可先多保留一位有效數字,運算后,再修約。
(4) 修約標準偏差。修約的結果應使精密度變得更差些。如S=0.213,取兩位有效數字,修約為0.22,取一位為0.3。
二、可疑值的取舍
在一組測定值中,常出現個別與其它數據相差很大的可疑值。如果確定知道此數據由實驗差錯引起,可以舍去,否則,應根據一定的統(tǒng)計學方法決定其取舍。統(tǒng)計學處理取舍的方法有多種,下面僅介紹二種常用的方法。
1 Q檢驗法
步驟如下
(1) 將測定值按大小順序排列,
(2) 由可疑值與其相鄰值之差的絕對值除以極差,求得Q值:
Q值愈大,表明可疑值離群愈遠,當Q值超過一定界限時應舍去。
(3) 查表得Q值,比較Q表與Q計判斷,當Q計≥Q表,該可疑值應舍去,否則應保留.
例例 測定某藥物中鈷的含量如(μg/g),得結果如下:1.25,1.27,1.31,1.40。試問用Q檢驗法判斷1.40這個數據是否應保留(置信度90%)?
解
已知n=4,查表7-6,Q0.09=0.76,Q<Q0.90,故1.40這個數據應予保留。
表7-6 Q值表
測定次數,n | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
置 信 度 | 90%(Q0.90) | 0.94 | 0.76 | 0.64 | 0.56 | 0.51 | 0.47 | 0.44 | 0.41 |
96%(Q0.96) | 0.98 | 0.85 | 0.73 | 0.64 | 0.59 | 0.54 | 0.51 | 0.48 | |
99%(Q0.99) | 0.99 | 0.93 | 0.82 | 0.74 | 0.68 | 0.63 | 0.60 | 0.57 |
2 格魯布斯(G)檢驗法
步驟如下:
(1) 求平均值和樣品標準偏差S
(2) 求G值:
(3)查表比較G表與G計判斷,若G計≥G表,可疑值應舍去。
表7-5 Ga
n | 顯著性水準α | ||
0.05 | 0.025 | 0.01 | |
3 4 5 6 7 8 9 10 11 12 13 14 15 20 | 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.29 2.33 2.37 2.41 2.56 | 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.29 2.36 2.41 2.46 2.51 2.55 2.71 | 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 32.55 2.61 2.63 2.71 2.88 |
三、顯著性檢驗
在進行對照試驗時,需對兩份樣品或兩個分析方法的分析結果進行顯著性檢驗,以判斷是否存在系統(tǒng)誤差。下面介紹兩種常用的顯著性檢驗方法。
t檢驗法
1.平均值與標準值的比較—準確度顯著性檢驗
(1) 根據首先由下式計算出t 值:
(2) 給出顯著性水平或置信度。
(3) 將計算出的t 值與表上查得的t 值進行比較,若t計≥t表,則平均值與標準值存在顯著性差異,為系統(tǒng)誤差引起,應查找原因,予以消除。
2兩組平均值的比較的方法
(1)F 檢驗法檢驗兩組實驗數據的精密度S1和S2之間有無顯著差異:
查表:精密度無顯著差異。
(2)t 檢驗確定兩組平均值之間有無顯著性差異
(3)查表:
(4)比較:無顯著差異,不存在系統(tǒng)誤差
第三節(jié) 分析工作的質量保證
3.1 分析測試的質量保證 Quality Assurance (QA)
3.2 測試過程中的質量保證
3.3測定數據的評價
利用準確度、精密度、靈敏度、檢出限、選擇性等數據特性來評價測定數據的有效性。
1、準確度的評價
A 標準物質
結果一致
C 與標準方法比較評價
3.4、工作曲線與靈敏度
單位量的待測物產生的信號定義為方法的靈敏度
3.5、檢出限:
首先我們看一下工作曲線:
檢出限定義: 在一定置信水平上被檢物產生的最小分析信號