序贯估计

目录导航

概念

序贯估计(sequential estimation)是用序贯方法处理的一种参数估计。是序贯分析的组成部分。但是,序贯估计的理论还未达到成熟的阶段。序贯估计的重要性表现在两方面:其一是序贯估计可以满足固定样本无法满足的要求,其二是有较高的效率。较为一般的序贯估计模型:设X1,X2,…是抽自F∈{F: F=F(·;θ),θ=(μ,η)∈Θ=(a,b)×Φ,-∞≤a<b≤∞}的简单样本。

注意事项

在序贯估计中,特别关注以下问题:

1.寻找参数μ的估计,它满足固定样本下无法满足的某种要求。如相对误差一致地小,或风险一致地不超过某一设定的界限等。参数η称为讨厌参数,它不是估计的对象,且往往起着不利于更确切估计μ的作用。

2.寻找给定长度和置信系数的置信区间。

序贯估计和序贯检验一样,由停止法则和估计法则两部分组成。前者决定何时停止抽样,后者给出如何根据观察值估计参数的方法。和序贯检验一样,停止法则用定义在R上的取整数值的可测函数τ=τ(X1,X2,…)表示停止时间。对任意自然数n,使得{τ=n}是以某可测集A∈B为底的柱集,B为n维波莱尔域,实际上和序贯检验的停止一样定义。估计量有形式d=d(X1,X2,…,Xτ)。从两方面衡量序贯估计的优良性:一是要求平均样本量尽量小;二是估计要有某种优良性,如无偏性,方差一致最小等,也可以是对估计精度的某种要求,如均方误差不超过设定界限,这种要求在固定样本下有时无法达到。若d=d(X1,X2,…,Xτ)是g(θ)的估计,满足Eθ(d)=g(θ),则称d为g(θ)的无偏估计。固定样本时,CR不等式给出了无偏估计方差的下界。美国学者沃尔弗威茨(Wolfowitz,J.)将这一结果推广到序贯估计情形:设X1,X2,…是独立同分布随机变量序列,其共同的分布密度函数为f(x;θ),θ∈(a,b),g(θ)是连续可微函数,g^(X1,X2,…,Xτ)是g(θ)的无偏估计。假定下列条件成立:

在(a,b)一致收敛,则必有:

此定理的证明和固定样本时类似。对固定样本X1,X2,…,Xn来讲:

但是对序贯样本可举出使:

成立和不成立的例子。因此要得到序贯无偏估计并非易事,具体问题要具体分析。在序贯估计中并不把寻求无偏估计作为重要目标。

序贯检验

基 于序贯抽样观测结果,运用序贯分析方法的统计假设检验。区分两个统计假设H0和H1的序贯检验,在序贯抽样观测的每一步应采取如下三种可能行动之一: 接受H0并停止观测;接受H1并停止观测;再进行一次观测。序贯检验规则可以表示为:1)对于每个n=1,2,…,将一切可能样本值(x1,…,xR)的集合划分为三个部分E0, Ec, E1; 2)当样本值 (X1,…,Xn)属于E0时接受H0并停止观测,当样本值属于E时接受H1并停止观测; 3)若样本值属于E,则再进行一 次观测,取得样本值 (X1,…,Xn, Xn+1),并在此基础上重复上述步骤; 4)依此类推,直到接受H0或接受H1为止。

序贯估计

数理统计的一个重要分支。它研究在样本容量不预先固定的前提下的统计推断的理论和方法。统计学中最基本的概念是总体和样本。总体用随机变量刻画,其特性用分布函数描述;样本由总体的若干个体组成,表现为数据,常称为观察值,由一组通常是独立同分布的随机变量来刻画。样本中所含观察值的个数称为样本容量。统计学的基本任务是根据样本推断总体特性。因为抽取样本需要费用,样本容量愈大费用愈高。因此自然希望在推断达到一定可靠度或精度的前提下,样本容量愈小愈好。而通常统计方法中样本容量是抽样前确定的,这种做法有时造成不必要的浪费,有时无法达到所要求的精度。例如验收一批产品是否合格,即检验该批产品的次品率是否小于给定值。固定样本验收方案是抽取n件产品,若次品数≥c,则拒收;否则接收。设当抽取到m (m<n)个产品时已发现有c个次品,这时理应停止抽样而拒收该批产品,但固定方案仍要求抽完n个,而造成浪费。在假设检验中,通常做法是只控制第一类错误,而在固定样本下,一般无法同时控制第二类错误。序贯分析是解决这些问题的统计方法,是研究如何进行序贯抽样和统计推断的统计学分支。序贯分析的思想可追溯到道奇(Dodge,H.F.)和罗明(Roming)于1929年提出的二样本验收方案:验收一批产品是否合格,分两阶段进行。第一阶段抽取N1个产品,其中次品数记为M1,根据M1的大小采取下面三个步骤之一:

1.如果M1≤c1,接收这批产品;

2.如果M1>c2,拒收这批产品;

3.如果c1<M1<c2,继续抽取N2个产品;

以M2记N2个产品中的次品数.据M1+M2的值作如下决定:

1.如果M1+M2≤c2,接收这批产品;

2.如果M1+M2>c2,拒收这批产品;

这种二阶段抽样方案由四个数N1,N2,c1,c2完全确定,是更一般的序贯验收方案的特例。该方案中包含两个要素:

1.停止法则:指明何时停止抽样;

2.决策法则:停止抽样后,如何根据样本做出推断。

上述两要素正是序贯分析的两要素,即一序贯分析方法由停止法则和决策法则组成。序贯分析的主要内容是序贯假设检验和序贯估计,以及延伸出的序贯选择问题。从方法上讲,如通常的固定样本统计一样,也有频率学派方法和贝叶斯学派方法之分。

参数估计

又称“抽样估计”、“母数估计”。推论性统计的一项基本内容,是用样本统计值来估计总体参数值的一种统计方法。例如,要了解某市居民对住房分配的满意程度,通常用抽样调查所得到的样本平均值、标准差与百分比等统计值来估计全市居民这一总体的平均值、标准差与百分比等参数值。参数估计可以分为点估计和区间估计。点估计是直接用样本统计值来估计一个单一的总体参数值,所以又称单值估计。点估计不考虑随机变量的抽样误差和概率分布,因而不能反映估计的参数与真正的总体指标有多大的误差以及估计的可靠程度。例如,假定上例中真正的总体指标是全市居民中42%的人对住房分配不太满意,但调查的样本统计值为40%,由于并不知道真正的总体指标为42%,所以不知道估计的参数与真正的总体指标有2%的误差。又假如从同一总体中抽样调查的另一个样本统计值为38%,那么究竟把哪一个统计值作为总体参数值是可靠的呢?所以点估计无法反映估计的误差和可靠程度。区间估计是以数值的区间形式来确定总体参数的可能范围。它根据概率抽样的理论,以一定的概率即可靠程度来保证真正的总体指标落在某一区间内。例如,假定上述对某市居民住房问题的调查,抽取的样本统计值表明,该样本中有40%的居民对住房不太满意。如果这次抽样是在95%的概率保证下进行的,其最大抽样误差为3%,这时就可以说,该总体真正的参数落在40%±3%的区间内,即全市居民有37%至43%的人对住房分配不太满意,这一结论有95%的可靠程度。在舆论调查中,参数估计主要用于两种情况:(1)用样本平均数()来估计总体平均数(M);(2)用样本比率(P)来估计总体比率(p)。上例就属于用样本比率来估计总体比率。区间估计中,以一定的概率即估计的可靠程度来保证总体参数落在某一区间内,这一区间的两个极端值不会超过允许的误差范围,这种情况下的概率即估计的可靠程度就称为可信度、置信度、可信系数或置信系数;这样的区间即为所需估计参数的可信区间或置信区间。如上例中95%的概率即为这次估计的可信度,参数值落入的区间(37%至43%)即为这次估计的可信区间。

相关百科
返回顶部
产品求购 求购