• 68阅读
  • 0回复

数理统计方法在医学和生物学上的应用 [复制链接]

上一主题 下一主题
离线admin
 

只看楼主 倒序阅读 0 发表于: 1962-08-07
第5版()
专栏:

数理统计方法在医学和生物学上的应用
杨纪珂
大家只要细心地观测自然界的事物,就会发现在观测数据间都存在着不同程度的变差,即能变性。例如,每棵果树上果子数各不相同,每微升血液中血球数都不相等,治愈结核病人的日期也各有短长。类此的变差是客观存在的,是必然而且是有普遍性的。
自然界任何事物的出现,都有一定的客观规律在起着必然性的作用。在这些规律中所涉及的内外因数在大小和程度上的配合方式是随机的,变差的出现正是由于这许多内外因数偶然性的配合所致。科学研究的目的就在于把这些客观规律剖析清楚,以求通过它们对同类事物加以估计和预测。
在对科学规律进行剖析的过程中,往往要从实验去量测那些在能予控制的条件下所生的必然性效应。可是,实验数据总是被其他许多无法控制的偶然组合成因数的综合性作用所打乱。当这种偶然性变差大到足以盖住因条件的变更而引起的变差时,就不能从结果数据来判断由条件所生效应的必然性规律。规律是客观存在着的,偶然性的背后隐藏着必然的联系。恩格斯说:“凡表面上看去是偶然性在起作用的地方,其实这种偶然性本身始终是服从于内部的隐藏着的规律的”(《费尔巴哈与德国古典哲学的终结》,人民出版社版,第38页)。只有对这种偶然性加以充分认识并加以掌握,才能从表现为偶然的数据中揭露出其中必然性的规律来。数理统计就是以描述偶然性内部隐藏着的规律的概率论为基础的一种科学分析方法,半个多世纪来,已成为在实验科学研究中所必不可少的工具。在实验数据变差较大的医学和生物学研究中,它尤其显得重要。华罗庚先生说数理统计方法应当是一种人所共知的科学分析方法,确是有其理由的。
一些数理统计的概念
在近代自然科学的研究中,有很大一部分的内容,是对各种作为现象的判据用的变数进行精细的量测。有不少医学和生物学方面的问题,已经或正在从定性转入到定量的研究中。在定量的基础上才能对相应的现象,作出更为精确和更有把握的估计和推断。各种变数都有一个包括全部数据在内的总体,实验数据往往只是其中一小部分的数据,即样品。在科学研究中,总体属于未知,样品来自实测。我们所期望知道和估计的是总体而不是样品,但所量测的是样品而不是总体。
为了使样品能以一定的置信程度来估计总体,为了使数理统计所依据的概率论发挥作用,研究工作者在抽取样品时必须采用随机的方法。简单的随机抽样法是把研究对象个体编成号码,然后用随机数字表抽取其中一部分的个体。对它们经实验过程后量测得的数据,就形成适用于数理统计分析的原始样品。
能变性的普遍存在使在各种总体或样品内所包含的数据成为参差[cēn-cī]不齐,如果把它们按照各数据的个体所占的百分率的次序作图,在绝大多数的情况下,总是形成俗语所谓“两头少、中间多”的频率分布图。总体的频率分布虽属未知,但也有一定的规律。从总体抽得的样品的频率分布,不论在与其总体之间,或在从同一总体抽得的各个样品的频率分布之间,虽并不一定互相吻合,但大都不离其宗。其中规律,可以通过概率论的推导求得。分布的种类很多,不能备述。有一点很容易被人忽略,值得一提。那就是对一群数据,单说出其平均数是不够的,还必须说出代表其间的变差程度的特征参数(如标准离差)。
单类总体的估计
有了分布的概念,我们就可以对单类的总体通过样品数据加以估计了。如果所要估计的是总体平均数,那就可以用样品平均数作为它的估计量。总体平均数是固定不变的,可是样品平均数是有变差的。我们如果从同一总体抽得好些样品,那末它们各自的样品平均数间不一定一致,也不一定就恰恰等于总体平均数。既有变差,当然就能作出其分布图。样品平均数的分布不但也是“两头少、中间多”,而且近似一个能用数学公式表示的正态分布,其中心更接近于总体平均数。这就是统计学上著名的“中心极限定理”的大意,它形成了数理统计在理论上的柱石。它可以通过抽样实验加以重演,是颠扑不破的。测量平均数的分布的展开度的判据是平均数的标准离差,特称之为标准误差,它的估计量可以从样品算得。
有了理论上的依据,就能推导出总体平均数有95%的可能性处在样品平均数上下约两倍标准误差的区间内。样品中数据如果不多,这个倍数也就要放大些。例如在对某人血球计数实验中,对总体一无所知(实际上要把他全部血球计数是不可能的),手头只有一个含五个数据的随机样品,即5.3、5.7、5.4、5.2、5.6百万/微升。计算出平均数5.44,标准误差.0928;查统计表知道对这样大的样品其倍数t是2.78;于是算得总体平均数有95%的可能性处在5.44±0.26即5.18至5.70百万/微升的区间之内。这样我们就对未知的总体平均数作了有科学根据的正确估计。
这种估计并不是绝对准的。要点在于人们可以说得出估计不准的概率是多少。在上例中它是5%,即有二十分之一的可能性估计不准,使实际的总体平均数在所估区间以外。我们当然可以把区间扩大以降低估计不准的概率。但目前在医学和生物学中,国际上都采用5%作为公认的人定水准。
平均数间的比较
在临床实验中常遇到比较各种药剂或疗法的疗效问题。譬如用疗法A处理十位高血压病人,又用疗法B在其它条件都相同的情况下处理其他十位病人。在经过一定治疗时期后,比较他们的血压差数。我们可以通过统计方法来比较这两组数据的平均数,从而说出这两种疗法间有无显著的差别,以及孰优孰劣。但这里必须不能忘记随机抽样的原则。如果我们有意无意地挑选十位年龄较高的人用疗法A来处理,另选十位年龄较小的用疗法B处理,那就犯了不随机抽样的错误,使得出的结论有失误的危险。
在生物学中例子也极多。例如以八头育肥期的猪饲以加了每体重一斤十微克维生素B12的饲料,另以同窠生成对的八头饲以不加B12的饲料,然后分别量测其平均日增重量。如果两者间的平均差数是零,当然说明其间并无区别。可是,我们必须记住这两群数据都是样品而非总体。即使从同一总体抽得的两个样品,它们间的平均差数也未必是零,因此从实验所得的平均差数不等于零也未必就是两组数据有显著性差异的证据。这是一个很重要的论点,忽视了它,就容易使所作出的判断得不到科学上的支持。如果要得出正确的判断,可以应用数理统计的方法。从同一个总体随机抽得的各对样品的平均差数不尽相等,它们之间也存在着变差,也有“两头少、中间多”的分布。因此,当平均差数大到约两倍于平均差数的标准误差时,原来的两个平均数属于同一总体的可能就只有5%左右了,这样才使我们有相当大的把握作结论说,加饲B12有效地促进增重。相反,如果还不到两倍(更精确的须查统计书里的t表),即使平均差数并不等于零,那就还没有足够置信的证据说B12 有效。当然,这不等于说B12是无效的。
事实上,数理统计只能以某种概率对某项有关总体的假设加以否定或不予否定,须与医学和生物学上的理论和经验知识结合起来才能作出如上的判断。它虽不能代替实验,也不能直接证明任何科学的理论,但有了它,科学研究工作者才可以从实验数据揭露出所要知道的科学资料,甚至找出其中的规律来,而不致为偶然性的变差所迷惑。
相关与回归
一群数据的变差愈大,就愈难跟另一群数据相辨别。我们虽然可以通过改进量测的精密度以缩小变差,但这并不能控制事物本身的变差。如果能引入第二个变数,那末只要用得恰当,往往可以有效地使变差缩小,大有利于科学的分析和判断。例如量测一至十八岁男孩的身高,如果只采取这一个变数,那末即使用带有测微装置的标尺来量,也不能改变他们在身高上大的变差这一事实。但是如果把年龄作为第二变数,使身高按年龄的次序分组作图,那末各年龄组的身高的变差就大为减小。其实,有许多科学问题都属于这个类型,只不过在判据上不那么通俗易晓罢了,而且也不像年龄和身高问题这样为人所共知。科学问题中的难事在于如何能找到这可以缩小第一种变数的变差的第二种变数。这需要下一番爬罗剔抉的苦工夫,一旦找到了,往往就是一项科学上的成就。这时候,我们说在这两变数间存在着相关——相互关系。计量相关的判据是相关系数。
回归是十九世纪统计学家高尔敦(Galton)所起的名词。计量回归的判据是回归系数。在直线回归中,它是一变数每变更一单位所引起的在另一变数上的变更量。严格说来,当两变数间存在着从属的关系时用回归,否则就用相关。但在实用上差别不大,可以互相借用。
举一个研究癌[ái]症的例子。用极谱仪测出血清的极谱,如果只量测其一个变数——双峰差,那末由于变差颇大,不能用它来鉴别癌的有无。但是,如果细加搜索,发现如把谱上某一特征点的波高作为第二变数引入,而把双峰差按这特征波高分类作图,那末变差就大为缩小,且发现在同量的特征波高处癌患者和正常人的双峰差存在着差异。假如它有统计学上的显著性,并且样品属随机抽得,能在统计意义上代表总体的话,则通过回归线上的估计量,用极谱仪对少量血液作分析就能以一定的置信程度判断癌的有无了。
有时两变数间并无相关,或者相关尚未达到统计学上显著性的水准,就不可遽[jù]下结论,说它们之间存在着相关。此外,如果在一群散乱的点子间没有科学依据地任意画上一根线,那也是不对的。只有用统计方法检定相关系数和回归系数是否已达显著性水准,才能不被偶然性的变差所混淆。达到了显著性水平,然后可以用最小二乘法来安配回归线。这种方法简单地说,就是找出在回归线上的估计值与相应的实测值间差距的平方之和为最小时该线的位置。
属性的统计
有许多属性不能用一定的单位加以量测,例如成败、死活、黑白等,可以用属性统计的方法通过对具有相同属性的个体的计数来分析。1899年庇尔逊(Pearson)提出了一个测量实计数和预计数之间的偏离度的指数X2(X是希腊字母,发音近似kai)。用X2的分布对属性进行检定的方法,至今还普遍地应用在科学研究中。X2的定义是预计数和实计数间差数的平方与预计数的比值的总计。这种检定法可以用以下两个例子来说明。
有人调查肺癌病人和正常人吸烟情况。在随机抽取的二十四名肺癌病人中有十六人吸烟,八人不吸;在随机抽取的三十六名正常人中有十四人吸烟,二十二人不吸。先假设不论吸烟与否,患肺癌的机会大家相等。用配分比例法算出在这个假设下这四类人的预计数为十二、十二、十八、十八,然而实计数却是十六、八、十四、二十二。计算出X2为4.44。理论上推导出从这个假设的总体随机抽样所得的X2有95%都不超过3.84,现在所得样品的X2比它大,就意味着以上机会均等的可能性就不比5%大了。这样,我们就可以在统计学上否定了这个假设,而下推断说吸烟的得肺癌的机会比不吸烟的大得多。这当然不等于说吸烟者必定要生肺癌。还须注意,这种推断总还有些说错的可能性,不过X2愈大,上述假设被否定的说错的可能性也就愈小。
另外,最近有人发现白血球抗原受着一对显性和隐性基因的遗传控制。从这样一个理论算出的预计数和实计数之间是如此地吻合使X2都在2以内,有的还不到0.1。因此,我们就找不到任何可以否定这个理论上的假设的证据。在找到这种反面的证据之前,我们可以暂时承认这项理论或假设是对的。
许多自然科学上的推断都不是绝对的。通过不同的推导和实验,有科学依据的论证如果都指向同一点结论,在同时尚未见到相反的证据时,这项结论就具有生存下去的生命力。有时在获得了相反的证据,而这些新证据确实有合乎科学实验和科学分析的依据的话,旧的理论就要更正甚至被舍弃。
方差分析和实验设计
1928年费歇尔(Fisher)发现了能把各种变差来源的均方加以析离的方法。如果某项变差来源的均方大于衡量样品内部偶然性变差的均方F倍,而F值大于理论上在5%水准处的F时,那末该项变差来源的必然性效应就从偶然性变差中显示出来了。这个统计方法被称为方差分析,它在数理统计的析因方面应用很广,而且为实验设计打开了道路。
方差分析的关键,在于计算各变差来源的均方用的平方之和以及自由度(均方等于平方之和除以自由度),两项计量都有一种可加性,能按照不同的变差来源从总的平方之和或自由度逐项划分出来。它们于是可以从样品数据计算,用F检定法就得以在5%估计不准的概率的人定水准下辨认各项的效应。方差分析的原则是一个,但在计算上随着实验的安排组合而异。而且如果安排得不好,分析起来就要发生困难,甚至无法分析。因此,随着而来的就是各式各样实验设计的产生。
在数理统计的观点上,一个良好的实验设计须达到以下的几项准则:使从实验所得数据能够进行统计分析,既不阙失必要的数据,也不使数据有浪费的多余;使所得数据经统计分析后不致发生偏倚,从而使结论失误;合理地制定样品的大小,使时间、活劳动和物化劳动作最低限度的消耗。此外在不少实验中,不能对最后的结果作出先期的臆度,必须根据上阶段实验结果经统计计算和分析作出的结论,才可以为下一阶段的实验作出合理的设计。
良好的实验设计是作出研究成果的重要因素,要得到它必须要求实验工作者和统计工作者一开始就密切相配合。统计工作者应尽量使他们所设计的实验方案为实验者所了解,他们自己也应充分了解有关该实验的知识和特点。统计方法虽是实验工作所不可缺少的有力工具,但不能代替实验工作。一个不佳的实验是不能依赖统计方法弥补其缺陷的。为了使实验结果成为有用而可靠的科学资料,为了使辛勤的劳动不致白费,我们必须了解数理统计方法,认真地去安排和设计科学研究的实验。
医学科学中的临床实验要比其他科学实验困难得多。由于研究的对象是人体,所以我们首先必须在不损害人体健康的原则下进行研究工作。凡是尚未证实是无害的药剂和疗法,都不能轻易在人体上作试验,这是我们社会主义国家一切医务工作者所应共同遵守的原则。因此,很多探索性医学研究是先在鼠、兔、狗、猴身上作实验的,只有在肯定稳妥的条件下才允许在人体上进行实验。但是,要用动物身上得到的数据和统计量定量地去估计人体的效应,我们就遭遇到相似论上的困难。虽然,在不少凡例中定性地估计仍然不失为有用的。
在研究某种疗法的疗效时,我们必须注意因偏倚而引起的不正确的结论。引起偏倚的可能性有下列一些:一种是由于一些与处理无关的条件所引起的偏倚,被误认为是由处理所生的效果;另一种是由于对照和处理先后不同时或不同地所引起的偏倚;还有一种偏倚是对一些缺乏诊断量测方法的症状,一般只凭医生病人间的问答作为判据的计数数据,往往引起不正确的结论。后者是因为病人的感觉不仅在程度上没有共同的标尺,而且他们的心理作用也左右着答词。对这类资料的处理必须审慎。寻找各种症状的判据和量测方法,是科学研究中的重要任务。
正因为这些研究上的困难,所以作过长期医务工作的老医生的经验是宝贵的。所谓经验,无非是某人对自然界的某种客观现象经过长期积累的实践和观察,在他脑子里不自觉地留下的对于该现象的统计分布和变差的影象,从这些影象可以用来判断和估计将要出现的事物。如果说有经验的人都是不自觉的统计学者,其实也不为过。如果一位青年医生能够掌握数理统计方法,把它作为工具来分析他的实验数据,那末只要有足够的实践和材料,他也就可以在短得多的时间内成为有经验的医师或医学科学家。
最优点的探索和进展统计
鲍克斯(Box)在1951年提出的序列实验设计法,已在许多其他科学中被广泛地采用。在医学和生物学中当然也有好些问题值得考虑采用此法,例如最优疗效的探寻,最优剂量的规定等。由于涉及的数学面较广,这里只能作些概括性的叙述。
首先,在小范围内作出一些多因次二水准的析因实验,把结果数据用回归计算法,找出其附近响应面的陡度。其次,沿最大陡度的方向变更各变数的水准上升(或下降)再作实验,如此一直进展到陡度成为很小时为止。再次,在所达到的脊线附近作一个中心混合实验,从所得数据用多重回归的方法,配出一组二次响应曲面。这样,就可以估计出最优点所在处各因数的水准了。最后在最优点附近再作些验证性的实验加以证实和调整。
寻觅最优点可以跟在大雾中爬山相模拟,不过所依靠的不是罗盘和眼睛,而是数理统计方法和有关的科学知识。最后找到最优点不是靠两条腿,而是靠设计得很好的、稳扎稳打、循序作最快速前进的实验群。这样就不致被偶然性的变差迷乱方向。
在好些实验中,由于一时样品太少,还不能用来显示出对照和处理组间的显著性差异时,我们可以采取鲍克斯1957年提出的进展统计法。例如,已有疗法A能治疗某种疾病,后又发现另一种疗法也属有效,新疗法必须在疗效上胜过旧法才能取而代之,但一时这类病例还不足以多到能用统计法加以辨别的程度,这时,可以把体况差不多的病人配成对子,分别随机施以新旧法的处理。所得结果可以保留起来,与以后同类的数据合并统计。如果仍乏显著性,那末可再保留为他日之用,直到一天用统计法对积累的数据能定出何者属显著的优越时为止。当然,如经长期还不能辨别其优劣,则在取舍之间应视经济费用和技术复杂性等其他因素而定。
医学上的档案和遗产
如把历来许多医生对某种疾病所作的诊治记录进行统计分析,也往往可以发掘或摸索出有用的医学科学的规律来。医院中病历档案的可贵就在于此,是需要重视的。
此外,如果我们能够用近代科学的方法,对祖国医学遗产加以实验和分析,相信一定可以把其中优良有效的部分整理出来,为我国医学科学的事业增添光辉。如把数理统计方法作为安排实验和分析数据的工具,与临床实验、生理生化等科学结合起来,良好成果的出现是可以预卜的。
快速回复
限200 字节
 
上一个 下一个