产生背景
在20世纪80年代初,英国杰出的生物统计学家雷沙尔·皮托(Rechard Peto)遇到了一个难题,当时他正在分析比较不同癌症治疗方法的临床试验结果。根据费歇尔实验设计规定,典型临床实验研究要求确定需要治疗的病人群体,并且采用随机的方法分配给病人不同的治疗实验方法。
数据的分析应该是相当直接的,用费歇尔方法,只要在不同治疗方法的组别间,比较病人的5年存活率即可。另外还可以进行更加精确的比较,就是用奥伦(Aalen)的鞅方法(martingale approach),分析从开始研究到每个病人死亡的时间,以此作为衡量治疗效果的基本标准。不论是哪种方法,分析结果的准确性取决于最初分配给病人采用治疗方法的随机选择。根据费歇尔定律,指定病人采取何种治疗方法与研究的结果是完全不相关的,假设检验的P值是可以计算出来的。
产生原因
皮托的难题是所有病人的治疗方法并不是随机指定的。这些病人也是人,正饱尝病痛的折磨,而且很多人得的是绝症,因此医生沉得有责任放弃实验性的治疗,或者如果觉得对于病人来讲是最好的选择的话,至少也要进行方案的调整。盲目地照搬某种治疗方法而不考虑病人的需要和反应是不首先的。与费歇尔的实验设计要求相矛盾,在这些实验中的病人经常变换治疗方法,而对治疗方法的选择主要取决于病人的治疗效果,如果效果好可能会继续采用这种方法,一旦觉得治疗效果不理想就会改变治疗方法。
研究误区
这是癌症研究中的一个典型问题。从20世纪50年代人们刚刚开始研究癌症起,这就一直是一个令人困扰的问题,直到皮托涉入此领域研究之前,通常的做法只是去分析那些坚持采用随机分配治疗方法的病人,而其他的病人不在分析的范围之内。皮托认为这会导致严重的错误。例如,假设我们正在比较两种治疗方法,一种是有效的治疗,另一种只是给病人服用安慰剂,即一种没有生物作用的药物。如果病人对治疗无反应,就会转而使用常规的治疗。服用安慰剂、没有效果就转而使用别的治疗方法的病人不能做为研究对象,只有那些继续服用安慰剂、因为某些原因有反应的病人才是研究的对象。如果在研究分析中的研究对象只有那些继续服用安慰剂并且有反应的病人,那么研究的结果必然是:安慰剂治疗方法与有效的治疗具有同样的疗效,甚至可能疗效更好。
最早提出
德克萨斯州安德森医院(M. C. Anderson Hospital)的埃德蒙·吉亨(Edmund Gehan)比皮托更早发现了这个问题。他当时的办法只是提出:因为这些研究不符合费歇尔实验的条件,所以不能够作为比较不同治疗方法的有效实验,只能算是研究中通过对采用不同治疗方法病人仔细观察而取得的记录,最多只是对实验结果的一种总体描述,为以后的治疗提供了一些思路。后来,吉亨也考虑了解决这个问题的不同方法,但是他的第一个结论让人非常气馁,竭力想在一个设计和执行都不好的实验中运用统计分析方法看来是不可能的。
皮托提出了一个直截了当的解决方法:当比较不同的治疗方法的疗效时,病人采用哪种治疗方法应该是随机的,否则不可能在假设检验中计算出P值。他建议在分析过程中假定每个接受治疗的病人采用治疗方法是随机分配的,否则不可能在假设检验中计算出P值。他建议在分析过程中假定每个接受治疗的病人采用治疗方法是随机分配的,忽略研究中治疗方法的调整。
如果一个病人随机采用方法A,但在研究结束前改变了方法,这个病人视为采用A方法的病人进行研究;如果病人随机采用方法A只治疗了一个星期,病人当作采用方法A来分析;如果病人随机采用A方法治疗,却根本没有吃一粒A方法的药,就采用了另外一种治疗方法,这个病人仍被视为采用方法A的病人。
乍一看这种方法是愚蠢的。人们可以假设一种情形:对一个实验治疗方法和一个标准治疗方法进行比较,病人采用的实验治疗方法一旦失败就会转而使用标准方法。如果实验治疗方法是无用的,那么,所有的或者大多数被随机指定使用实验治疗方法的病人就会转而使用标准方法,分析将会发现这两种治疗方法效果是一样的。正如皮托在他的假设中指出的,这种分析研究结果的方法不能用于比较疗效相同的治疗方法,只有当疗效“不同”时才可使用。
皮托的方法后来被称为“意向治疗”(intert to treat)分析方法。这样命名的理由及其用途是:如果我们对医疗政策的总体结果感兴趣的话(该政策通常会推荐使用某个治疗方案),就得授权引而伸之医生,让他可以按照他的判断去调整治疗方法。用皮托的方法,临床实验的分析可以判断:建议使用一个给定的方法作为治疗的起点,是不是一个好的公共政策。“意向治疗”分析方法最被认为是一种很好的方法,适合用于那些政府资助的、为制定好的公共政策而进行的大型研究。
很不幸的是,有些科学家往往在并不了解和理解其背后数学含义的情况下,随意地把一些统计方法拿过来就用,这在临床研究中是司空见惯的。皮托早就指出了他的方法的局限性,但是意向治疗方法不但已经成为许多大学里的医科教条,并且被认为是临床实验唯一正确的统计分析方法。在许多临床实验中,尤其是对癌症的研究实验,实验设计是为了证明新的治疗方法至少与标准治疗方法效果相同,同时副作用较小。很多的实验目的是为了显示新疗法的等效性。正如皮托指出的,他的方法只能用来找出差别,但是,如果没有找出差异也并不代表两种方法的疗效相同。
某种程度上,这个问题的产生主要是因为奈曼-皮尔逊理论的刚性。在基础统计学的教科书里都可找到奈曼-皮尔逊理论的标准版本,假设检验往往被介绍为一种固定的程序,方法中许多完全随意的方面也被描述成不变的。