在一组平行测定数据中,常会出现与其他结果相差较大的个别测定值,该值称为可疑值或异常值(也叫离散值或者极端值等)。对于位数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。
如果已经测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计学方法进行检验,然后再对取舍做出判断。以下介绍使用简单的Q检验法和效果好的格鲁布斯法。
该法有迪安和狄克逊在1951年提出。具体步骤:
1、将一组数据有小至大按顺序排列为x1,x2,x3…xn-1,xn,假设x1和或xn为可疑值。
2、计算可疑值与最邻近数据的差值,除以极差,所得的商称为Q值。
若x1为可疑值,则:
Q=(x2-x1)/(xn-x1)
若xn为可疑值,则:
Q=(xn-xn-1)/(xn-x1)
首先计算出改组数据的平均值x和标准偏差s,再计算统计量G:
G=Ix疑-xI/s
根据事先确定的置信度和测定次数查阅表4-6的G值表,如果G>G表,说明可疑值相对于平均值偏离较大,应以一定的置信度将其舍去,否则应予以保留。