设一组数据x1,x2,x3……xn中,各组数据与它们的平均数的差的平方分别是(x1-),(x2-)……(xn-),那么我们用他们的平均数来衡量这组数据的波动大小,并把它叫做这组数据的方差。为了简便(其中x为该组数据的平均值)。
总之,方差越小就越稳定。
已知离散型方差分布列:
X | x1 | x2 | ... | xn | ... |
P | p1 | p2 | ... | pn | ... |
DX公式刻画了随机变量X与其平均值EX的平均偏差程度,称DX为随机变量X的方差。为X的标准差(Standard Deviation)或均方差,记为σX。
X | x1 | x2 | ... | xn | ... |
P | p1 | p2 | ... | pn | ... |
方差的性质
1.设C为常数,则D(C) = 0(常数无波动);
2.(常数平方提取);
证:
特别地 D(-X) = D(X), D(-2X ) = 4D(X)(方差无负值)
3.若X 、Y 相互独立,则证:记则
前面两项恰为 D(X)和D(Y),第三项展开后为
当X、Y 相互独立时,
故第三项为零。
特别地
独立前提的逐项求和,可推广到有限项。
平均数:(n表示这组数据个数,x1、x2、x3……xn表示这组数据具体数值)
方差公式:
标准方差公式(1):
标准方差公式(2):
设随机变量X具有数学期望,方差,则对于任意正数,不等式
成立。这一不等式成为切比雪夫(Chebyshev)不等式。
常用分布的方差
1.两点分布
2.二项分布X ~ B ( n, p )
引入随机变量Xi (第i次试验中A 出现的次数,服从两点分布)
3.泊松分布(推导略)
4.均匀分布另一计算过程为
5.指数分布(推导略)
6.正态分布(推导略)
7.t分布:其中X~T(n),E(X)=0;
8.F分布:其中X~F(m,n),
正态分布的后一参数反映它与均值的偏离程度,即波动程度(随机波动),这与图形的特征是相符的。