误差平方和

目录导航

基本介绍

总偏差平方和

在单因素方差分析(见下文)中，为了使造成各随机变量X_ij之间的差异的大小能定量表示出来，引入：

记在水平A_i下样本和为，其样本均值为因素A下的所有水平的样本总均值为

为了通过分析对比产生样本

之间差异性的原因，从而确定因素A的影响是否显著，我们引人偏差平方和来度量各个体间的差异程度

因S_T能反映全部试验数据之间的差异，所以又称为总偏差平方和。

误差平方和与组间平方和

如果H₀成立，则r个总体间无显著差异，也就是说因素A对指标没有显著影响，所有的X_ij可以认为来自同一个总体，各个X_ij间的差异只是由随机因素引起的，若H₀不成立，则在总偏差中，除随机因素引起的差异外，还包括由因素A的不同水平的作用而产生的差异，如果不同水平作用产生的差异比随机因素引起的差异大得多，就认为因素A对指标有显著影响，否则，认为无显著影响。为此，可将总偏差中的这两种差异分开，然后进行比较。

记

则有下面的定理：

定理1(平方和分解定理)令，有

S_E表示在水平A_i下样本值与样本均值之间的差异，它是由随机误差引起的，称为误差平方和或组内平方和。S_A反映在每个水平下的样本均值与样本总均值的差异，它是由因素A取不同水平引起的，称为因素A的效应平方和或组间平方和，S_T=S_E+S_A式就是我们所需要的平方和分解式。

SE与SA的统计特性

如果H₀成立，则所有的X_ij都服从正态分布，且相互独立，则有：

定理2

(1)，且，所以为σ²的无偏估计；

(2)，且，因此为σ²的无偏估计；

(3)S_E与S_A相互独立；

(4)。

单因素方差分析

基本概念

在方差分析中，我们将要考察的对象的某种特征称为试验指标，影响试验指标的条件称为因素，因素可分为两类，一类是人们可以控制的(如原材料、设备、学历、专业等因素)；另一类人们无法摔制的(如员工素质与机遇等因素)。下面所讨论的因素都是指可控制因素。每个因素又有若干个状态可供选择，因素可供选择的每个状态称为该因素的水平。如果在一项试验中只有一个因素在改变，则称为单因素试验；如果多于一个因素在改变，则称为多因素试验。因素常用大写字母A，B，C，…来表示，因素A的水平用来表示，下面对单因素试验进行讨论^[2]。