第三章误差及分析数据处理
第一节 分析化学中的误差概念
一、误差-(Error)测量值(X)与真值(μ)之间的差值(E)。
二、误差的来源(Sources of error)
(1)系统误差(systematic error)由固定的原因造成的,使测定结果系统偏高或偏低,重复出现,其大小可测,具有“单向性”,可用校正法消除。
根据其产生的原因分为以下4种。
*方法误差(method error):分析方法本身不完善而引起的。
* 仪器和试剂误差(instrumentand reagent error):仪器本身不够精确,试剂不纯引起误差。
*操作误差(operational error):分析人员操作与正确操作差别引起的。
*主观误差(Personal error):分析人员本身主观因素引起的
系统误差特点i 重现性;ii 单向性;iii 恒定性。通常加校正值的方法消除系统误差。
(2)随机误差(random error,accidental error,indeterminate error)由一些随机偶然原因造成的、可变的、无法避免,符合“正态分布”。
(3)过失误差,显著误差(Grossmistake)由于分析人员不小心引起,例如操作错误、运算和记录错误。
三、准确度与精密度
准确度与误差
1.准确度(accuracy) 测量值与真实值的接近程度,用绝对误差或相对误差表示。
(1)绝对误差:( Absolute error,AE) 绝对误差表示测量值(X)与真值(μ)的差。
AE=X-μ
(2) 相对误差(Relative error, RE)
RE% = AE / μ× 100%
例:用分析天平称样,一份0.2000克,一份0.0020克,称量的绝对误差均为+0.0002克,问两次称量的RE%?
解:第一份试样
RE1%=+0.0002÷0.2000×100%=+0.1%
第二份试样
RE2%=+0.0002÷0.0020×100%=+10%
由此可以看出,绝对误差一样的情况下,物质的质量越大,其称量的相对误差就越小,即准确度就越高。
精密度和偏差
精密度(Precision)用相同的方法对同一个试样平行测定多次,得到结果的相互接近程度。以偏差来衡量其好坏。
重复性(Repeatability)同一分析人员在同一条件下所得分析结果的精密度。
再现性(Reproducibility)不同分析人员或不同实验室之间各自的条件下所得分析结果得精密度。
偏差(Deviation) 一组是表示个别测量值与平均值之间的差值,一组分析结果的精密度可以用平均偏差和标准偏差两种方法来表示。
绝对偏差(Absolutedeviation)
相对偏差(Relativedeviation)
di 和RD 只能衡量每个测量值与平均值的偏离程度
平均偏差:为各次测定值的偏差的绝对值的平均值,
式中n为测量次数。由于各测量值的绝对偏差有正有负,取平均值时会相互抵消。只有取偏差的绝对值的平均值才能正确反映一组重复测定值间的符合程度。
相对平均偏差:为平均偏差与平均值之比,常用百分率表示:
标准偏差(standard deviation; S)
使用标准偏差是为了突出较大偏差的影响。
相对标准偏差(RSD)或称变异系数,实际工作中都用RSD表示分析结果的精密度。
平均值的标准偏差:
设有一样品,m个分析工作者对其进行分析,每人测 n 次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。
对有限次测量:
结论:
1、增加测量次数可以提高精密度。
2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。
三、准确度与精密度的关系
例:A、B、C、D 四个分析工作者对同一铁标样中的铁含量进行测量,得结果如图示,比较其准确度与精密度。
1、准确度反应的是测定值与真实值的符合程度。
2、精密度反应的则是测定值与平均值的偏离程度;
3、精密度高是准确度高的前提,但精密度高,准确度不一定高。
四、随机误差的统计概念
(一)、误差的统计概念
2、随机误差的正态分布:测量数据一般符合正态分布规律,即高斯分布,正态分布曲线数学表达式为:
y:概率密度;x:测量值。
μ:总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。
σ:标准偏差,反映测量值分布的分散程度;
x-μ:随机误差
3、正态分布曲线规律:
* x=μ 时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。μ反映测量值分布集中趋势。
* 曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。
* 当x趋于-∞或+∞时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。
*σ越大,测量值落在μ附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。σ反映测量值分布分散程度。
4、标准正态分布曲线
横坐标改为u,纵坐标为概率密度,此时曲线的形状与σ大小无关,不同σ的曲线合为一条。
5、随机误差的区间概率
正态分布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即概率P为:
随机误差出现的区间测量值出现的区间 概率(以σ为单位)
u=±1 x=μ±1σ 68.3%
u=±1.96 x=μ±1.96σ 95.0%
u=±2 x=μ±2σ 95.5%
u=±2.58 x=μ±2.58σ 99.0%
u=±3&nbs医学招聘网p; x=μ±3σ99.7%
(二)、少量数据的统计处理
1 t 分布曲线
正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t 分布曲线处理。用s代替σ,纵坐标仍为概率密度,但横坐标则为统计量t。
t定义为:
自由度f — degree of freedom ( f = n-1)
t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近∞时,t分布就趋近正态分布。
置信度(P)confidencedegree在某一t值时,测定值落在(μ+ts)范围内的概率。
置信水平(α)confidence level在某一t值时,测定值落在(μ+ts)范围以外的概率(l-P)。
ta,f :t值与置信度P及自由度f关系。
例: t0·05,10表示置信度为95%,自由度为10时的t值。
t0·01,5表示置信度为99%,自由度为5时的t值。
2 平均值的置信区间(confidence interval)
当n趋近∞时:单次测量结果:
以样本平均值来估计总体平均值可能存在的区间:
对医学.全在线www.lindalemus.com于少量测量数据,即当n有限时,必须根据t分布进行统计处理:
它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。
第二节 分析数据的处理
一、有效数字及其运算规则
1、有效数字(significant figure)
分析工作中实际上实际能测到的数字。在有效数字中,只有最后一位数是不确定的,可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。
2、位数确定
(1) 记录测量数据时,只允许保留一位可疑数字。
(2) 有效数字的位数反映了测量的相对误差,不能随意舍去最后一位数字。
(3) 数据中的“0”作具体分析,如1.2007g, 0.0012007kg均为五位有效数值,
(4) 常数π等非测量所得数据,视为无限多位有效数字;
(5) pH、pM等对数值,有效数字位数仅取决于小数部分数字的位数。如pH=10.20,应为两位有效数值
看看下面各数的有效数字的位数:
1.0008 43181 五位有效数字
0.1000 10.98% 四位有效数字
0.0382 1.98×10-10 三位有效数字
54 0.0040 二位有效数字
0.05 2×105 一位有效数字
3600100 位数模糊
PH=11.20对应于[H+]=6.3×10-12 二位有效数字
3、有效数字的计算规则
(1) 数值相加减时,结果保留小数点后位数应与小数点后位数最少者相同
(绝对误差最大)
0.0121+12.56+7.8432=0.01+12.56+7.84=20.41
总绝对误差取决于绝对误差大的
(2) 数值相乘除时,结果保留位数应与有效数字位数最少者相同。(相对误差最大),
(0.0142×24.43×305.84)/28.7=(0.0142×24.4×306)/28.7=3.69
总相对误差取决于相对误差大的。
(3) 乘方或开方时,结果有效数字位数不变。
如 ,
(4) 对数运算时,对数尾数的位数应与真数有效数字位数相同;
如
尾数0.20与真数(6.3)都为二位有效数字,而不是四位有效数字。
4、数字修约规则
(1)四舍六入五成双。如测量值为4.135、4.125、4.105、4.1251;修约为4.14、4.12、4.10和4.13。
(2)只允许对原测量值一次修约至所需位数,不能分次修约。如4.1349修约为三位数。不能先修约成4.135,再修约为4.14,只能修约成4.13。
(3) 大量数据运算时,可先多保留一位有效数字,运算后,再修约。
(4) 修约标准偏差。修约的结果应使精密度变得更差些。如S=0.213,取两位有效数字,修约为0.22,取一位为0.3。
二、可疑值的取舍
在一组测定值中,常出现个别与其它数据相差很大的可疑值。如果确定知道此数据由实验差错引起,可以舍去,否则,应根据一定的统计学方法决定其取舍。统计学处理取舍的方法有多种,下面仅介绍二种常用的方法。
1 Q检验法
步骤如下
(1) 将测定值按大小顺序排列,
(2) 由可疑值与其相邻值之差的绝对值除以极差,求得Q值:
Q值愈大,表明可疑值离群愈远,当Q值超过一定界限时应舍去。
(3) 查表得Q值,比较Q表与Q计判断,当Q计≥Q表,该可疑值应舍去,否则应保留.
例例 测定某药物中钴的含量如(μg/g),得结果如下:1.25,1.27,1.31,1.40。试问用Q检验法判断1.40这个数据是否应保留(置信度90%)?
解
已知n=4,查表7-6,Q0.09=0.76,Q<Q0.90,故1.40这个数据应予保留。
表7-6 Q值表
测定次数,n | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
置 信 度 | 90%(Q0.90) | 0.94 | 0.76 | 0.64 | 0.56 | 0.51 | 0.47 | 0.44 | 0.41 |
96%(Q0.96) | 0.98 | 0.85 | 0.73 | 0.64 | 0.59 | 0.54 | 0.51 | 0.48 | |
99%(Q0.99) | 0.99 | 0.93 | 0.82 | 0.74 | 0.68 | 0.63 | 0.60 | 0.57 |
2 格鲁布斯(G)检验法
步骤如下:
(1) 求平均值和样品标准偏差S
(2) 求G值:
(3)查表比较G表与G计判断,若G计≥G表,可疑值应舍去。
表7-5 Ga
n | 显著性水准α | ||
0.05 | 0.025 | 0.01 | |
3 4 5 6 7 8 9 10 11 12 13 14 15 20 | 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.29 2.33 2.37 2.41 2.56 | 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.29 2.36 2.41 2.46 2.51 2.55 2.71 | 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 32.55 2.61 2.63 2.71 2.88 |
三、显著性检验
在进行对照试验时,需对两份样品或两个分析方法的分析结果进行显著性检验,以判断是否存在系统误差。下面介绍两种常用的显著性检验方法。
t检验法
1.平均值与标准值的比较—准确度显著性检验
(1) 根据首先由下式计算出t 值:
(2) 给出显著性水平或置信度。
(3) 将计算出的t 值与表上查得的t 值进行比较,若t计≥t表,则平均值与标准值存在显著性差异,为系统误差引起,应查找原因,予以消除。
2两组平均值的比较的方法
(1)F 检验法检验两组实验数据的精密度S1和S2之间有无显著差异:
查表:精密度无显著差异。
(2)t 检验确定两组平均值之间有无显著性差异
(3)查表:
(4)比较:无显著差异,不存在系统误差
第三节 分析工作的质量保证
3.1 分析测试的质量保证 Quality Assurance (QA)
3.2 测试过程中的质量保证
3.3测定数据的评价
利用准确度、精密度、灵敏度、检出限、选择性等数据特性来评价测定数据的有效性。
1、准确度的评价
A 标准物质
结果一致
C 与标准方法比较评价
3.4、工作曲线与灵敏度
单位量的待测物产生的信号定义为方法的灵敏度
3.5、检出限:
首先我们看一下工作曲线:
检出限定义: 在一定置信水平上被检物产生的最小分析信号