2.2统计假设

     

2.2.1 概率概率意义

一、事件发生的概率

  在自然界或试验研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,每一种可能出现的情况或结果称为事件 (event)

   对某一种事件来说,在一组条件实现下必然发生的,称为必然事件 (certain event) ,常用 U 表示。例如,水在标准大气压下加热到 100 ° C 必然沸腾;任何物质在进行任何化学反 应时,如果与周围环境没有物质交换,则物质的总质量保持不变。

   如果在一组条件实现下根本不可能发生的事件,称为不可能事件 (impossible event) ,常用 V 表示。例如,水在标准大气压下加热到 100 ° C ,根本不可能结冰;用梨树芽嫁接长出的枝条不可能是苹果枝条。

   另一类事件,如果在一组条件实现下,可能发生也可能不发生的,如:一粒黄瓜种子播种后可能发芽也可能不发芽,这类事件称为随机事件 (random event) ,常用 A B C 等表示。

  必然事件和不可能事件的发生只要观察其一,就能推论其余的,对事件的发生有百分之百的预测性。

    随机事件的发生虽然具有不确定性,但并不是无规律可循,无法预测的。其事件的发生在一定程度上是可以预测的,这种预测性是由该事件的概率 (probability) 来决定的,这种用来表示某一随机事件出现可能性大小的数值称为该事件的概率。对于一个随机事件而言,它发生可能性大小的度量是由它自身决定的,并且是客观存在的,那么,它发生可能的度量——概率究竟是多大呢?一般情况下,概率获得的途径有两种:

  一种是从原理假设出发,来得到某一事件的概率。

  另一种是通过大量的观察和试验来估计某一事件的概率。

    

  在通常情况下,由于 P 是一个理论值,实际中 P 不可能准确获得的,所以人们常用 n 充分大时事件 A 的频率作为该事件概率 P 的近似值,即

P A =P (a/n) 6.1

  这样就能对任何随机事件出现的可能性作出估计。

  根据概率的定义可知,任一事件的概率不可能大于 1 ,因为表示概率的频率分数 a 不可能大于 n ,也不可能小于 0 ,因为分数中的 a 不可能小于 0 。它在数量上总是介于 0 1 之间,即 0<=P(A)<=1

二、事件间的关系及其概率的计算

  在生产实践中,某一随机事件的发生并不是孤立的,许多随机事件之间存在一定的联系,下面介绍事件间的几种主要关系。

(一)、和事件

  事件 A 与事件 B 至少有一件发生而构成的新事件称为事件 A 与事件 B 的和事件,用 A+B 表示。例如在调查某果园红富士苹果一年生枝条的生长量中,随机抽取一个枝条其长度是 30cm 以下为事件 A ,随机抽取一个枝条其长度在 30 -45cm 之间为事件 B ,则 A+B 为随机抽取一个枝条其长度是 45cm 以下的事件。事件间的和事件可以推广到多个事件:事件 A1 A2 A3 An 的和事件,记为 A1 +A2 +A3 + … +An

(二)、积事件

    事件 A B 同时发生或相继发生所构成的新事件称为事件 A B 的积事件,用 AB 表示。例如在两粒种子的发芽试验中,事件 A 指第一粒种子发芽,事件 B 指第二粒种子发芽,两粒种子均发芽这一新事件为事件 A 和事件 B 的积事件。事件间的积事件也可推广到多个事件:事件 A1 A2 A3 An 同时发生或相继发生所构成的新事件称为这 n 个事件的积事件,记为 A 1 A 2 A 3 … An

(三)、互斥事件

  事件 A B 如果不能同时发生,则称事件 A B 是互斥事件。例如设苹果的横径大于 7.5cm A 事件,小于 7.5cm B 事件,一个苹果横径不可能既大于 7.5cm 又小于 7.5cm ,说明事件 A B 是互斥的。这一定义也可推广到多个事件 A1 A2 A3 An

(四)、 对立事件

  事件 A B 如果不可能同时发生,但必发生其一,即 A+B 为必然事件, AB 为不可能事件,则称事件 A B 互为对立事件。上面的例子如果改为苹果的横径大于等于 7.5cm A 事件,小于 7.5cm B 事件,一个苹果横径不可能既大于等于 7.5cm 又小于 7.5cm ,但任意抽取一个苹果,事件 A B 必发生其一,所以称事件 A B 互为对立事件。

(五)、完全事件系

若事件A1 A2 A3 An 两两互斥,且每次试验结果必发生其一,则称事件 A1 A2 A3 An 为完全事件系。例如,如果苹果新梢的长度用 x 表示,设事件 A1 x< 15cm ,事件 A2 15 <= x <= 35cm ,事件 A3 x> 35cm ,那么,事件 A1 A2 A3就构成完全事件系

(一)、加法定理 :若事件 A 与事件 B 是互斥事件,其概率分别为 P(A) P(B) ,则事件 A B 的和事件的概率等于事件 A 的概率与事件 B 的概率之和

(二)、乘法定理

  若事件 A 的发生与否并不影响事件 B 发生的可能性,那么就称事件 A 和事件 B 相互独立。设事件 A 和事件 B 的概率分别为 P A )和 P B ),则事件 A 和事件 B 同时发生或相继发生的事件概率等于两个独立事件的概率之乘积。

 

2.2.2 二项分布与正态分布

一、重复试验的概率分布

  在试验或调查中所获得的非连续性变数资料,其随机变量取得的数值为有限个或无穷个孤立的值。如调查富士苹果的色泽,按着色面积的大小分为 5 4 3 2 1 级来表示,那么 5 4 3 2 1 就为随机变量 x 的取值。对于随机变量 x 的每一个可能取得的值都对应一个概率,这种一对一构成的分布称为非连续性变数的概率分布。

二、二项分布

(一)、二项总体

  在生物科学研究中,有些总体的各个个体的某种性状,只能发生非此即彼的两种结果,即观察值只有两类,用 0 1 表示, 0 1 为对立事件(有时虽然在实际上并不是只是”“两种事件,但在一定意义上可以看作只有此”“两种事件),这种由非此即彼事件构成的总体称为二项总体,又称为 0 1 总体。例如海棠种子播种后发芽与不发芽,就一粒种子而言,发芽与不发芽这两个事件只能实现其一,不会同时发生;植株的感病与不感病;花能否坐果;裂果与未裂果,喷施农药后害虫的死与活等等。这类变数均属非连续性变数,它们的概率分布也是不连续的。为研究方便,将二项总体中的事件以变量“ 1 ” 表示,其概率用 p 表示;将事件用变量“ 0 ” 表示,其概率用 q 表示,其概率显然有 p+q=1 1-p=q 的关系。

( ) 二项分布

  二项分布 (binomial distribution) 是一种最重要的非连续性随机变量的分布,是一种与重复试验相联系的概率分布。

三、正态分布

  正态分布 normal distribution )是连续性变数的理论分布,在生物统计学上占有极其重要的地位。首先,在生物和农业的研究中,许多试验和观察所获得的数据资料都服从正态分布规律。例如,在作物中,属于同一总体的各个个体之间通常是有变异的,如测量果树的生长量、产量等经济性状,这些数据分布是服从正态分布律的。因此可以用之来配合这些现象的样本分布,从而发现这些现象总体的理论分布。其次,在适当的条件下,它可以作为间断性变数的近似分布,这样就能够用正态分布来计算概率和进行假设测验。另外,虽然有些总体不做正态分布,但从总体中随机抽取出的样本统计数的分布,如即将介绍的样本平均数分布以及样本平均数差数分布,在样本容量适当大时仍然趋向于正态分布,因此,可以用正态分布来研究这些统计数的抽样分布。所以正态分布无论在理论还是在实践上均具有非常重要的意义。

2.2.3统计假设性测验

 

一、统计假设性测验

   从抽样分布可知,同一总体中抽出的若干样本,各样本的统计数间存在差异,这种差异是用误差来表示的。在科学研究中,往往会遇到这样的问题,例如某地的甘蓝良种,多年种植的平均亩产量为 2320kg (即总体的平均数 m= 2320kg ),其标准差 s = 530kg , 若一个新品种经多点试验,其平均亩产量为 2460kg (即样本平均数 = 2460kg ),试问这一新品种有无应用价值?从数值的表面看,该新品种的平均产量优于地方良种,即 2460-2320= 140kg 是试验的表面效应,造成这种差异的原因有两个:一是试验处理效应(或品种的生产力不同);另一个是试验的误差。如果不经分析,就很难判断这种差异是由取样的偶然试验误差造成的,还是由于品种本身确实有差异。为了判明这种差异产生的原因,必须运用统计分析的手段,就是用统计假设性测验的方法加以推断。

  统计假设性测验是指试验者根据试验的目的或某种实际需要,对某一未知或不完全知道的总体参数提出一些假设,然后根据样本的实际结果经过计算作出在概率的意义上应当接受哪个假设的测验。例如上例中首先假设新品种的平均亩产量与地方良种一样,或者假设它比地方良种更好,这个假设称为统计假设。但是如何证实假设是正确的还是错误的呢?一种方法是检验整个总体材料,获得全部结果进行判断。这种研究总体的方法是很准确的,但对总体直接进行研究的这种方法实际上是不可能进行的。因此一般情况是通过研究样本来研究其所代表的总体,所以可以将这一新品种种植 1-2 年,每一年种植若干小区,取得其平均产量,然后由之来推断原来假设是否正确。如果通过测验,发现假设与试验结果相符,则接受假设;反之,如果假设与试验结果不符合,该假设就被否定。从而确定新品种的产量是否优于地方良种,为新品种的推广提供理论依据。

二、统计假设性测验的基本步骤

  我们以平均数为例说明统计假设测验的基本步骤。

(一)首先对所研究的总体参数提出假设

  我们把试验的结果往往看作为一个样本,若要了解这个样本所属总体与已知总体的关系,可以假设该样本所属总体与已知总体是相同的,亦即该样本是从已知总体中随机抽取的,它们之间无本质的差异,这个假设称为无效假设。如以 m 代表样本所属总体的平均数, m0代表已知总体的平均数,则无效假设为 m - m0 =0(所以无效假设也叫零值假设),记作H0 : =mm 0。下面通过一个具体的事例说明。

6-13 对短枝红富士苹果进行生长期套袋处理试验,已知短枝红富士苹果可溶性固形物含量在当地经历年的测验,其平均数 m0 =14.5% 。采果后,随机抽取在生长期进行套袋处理的果实 50 个,测定其可溶性固形物含量,样本平均数 =13.8% 、标准差 s=2.1% 。试分析短枝红富士苹果果实进行生长期套袋处理后,其可溶性固形物含量是否与未进行套袋的苹果存在显著性差异?我们可以假设生长期进行套袋处理的短枝红富士苹果果实的可溶性固形物含量的平均数 m 等于未套袋苹果果实的平均数 m0 ,记为 H0 : =mm 0 = 14.5% ,而 m0 =-0.7% 是随机误差。

  如果比较两个样本的平均数是否真正存在差异,则可以假设两个样本所属总体的平均数相等。若两个总体的平均数分别用m 1 m 2表示,即 H0 : m1=m 2 ,也就是假设两个样本平均数差异 是随机误差,而非真实差异。无效假设是根据试验目的提出得到,虽然表现的形式不同,但必须有实际意义,并能在假设的前提下计算出因抽样误差而获得试验结果的概率。

  和无效假设相对的另一个统计假设称为备择假设或相对假设,记作 H0 : =mm 0 H0 : m1=m 2H0  HA应是对立事件。测验结果,如果接受无效假设当然否定备择假设;如果否定无效假设,则接受备择假设,说明实得的差异是由于总体参数不同造成的,并非随机误差所致。在进行统计假设测验时,应设置 H0  HA

  提出无效假设的目的在于可以从假设的总体中推论其平均数的抽样分布,从而可以计算出某一平均数指定值出现的概率,这样可以研究样本和总体的关系,作为假设性测验的理论依据。

(二) 确定显著水平

  确定显著水平 significance level 也就是要确定一个否定 0的概率标准, a 表示, a 为一小概率。生物统计上常采用 0.05 0.01 两个等级作为测验试验结果的差异是否显著的概率标准,即 a =0.05 a =0.01

  显著水平的确定是 应用概率论中的小概率事件实际不可能性原理 这个原理指出,如果我们假设了一些条件,并在这个假设条件下能准确地计算出事件 A 的概率 a为很小,则在假设条件下的无数次独立的重复试验中,事件 A 将按预定的概率发生,而在一次试验中则几乎不可能发生。如果在一次试验中,事件 A 恰恰发生了,则可合理地认为原来的假设不正确,应予否定,虽然这一推断属于错误的概率为 a

  显著水平的使用相当于在概率分布中划出一个界限,即将该分布划分成两个区域,一个是接受区域,是指试验结果的差异是因抽样误差造成的,因此应该接受无效假设;另一个区域是否定区域,是指试验结果的差异不是由随机误差造成的,应该否定无效假设。图 6-6 5% 显著水平 u 测验图示,该图表明在分布的两尾各有一个否定 0区域,其概率各为 2.5% ,接受区域的概率为 95% 。如果规定的显著水平为 a =0.01 ,则其两尾的否定 0区域各为 0.5%   

 

6-6 5% 显著水平统计假设测验图示

  统计假设测验选用的显著水平,除 a =0.05 a =0.01 外,有时也选用 a =0.10 a =0.001 ,那么究竟选择哪种显著水平,应根据试验的要求和试验结果的重要性而定。对于一般栽培试验,试验植株间的变异系数大,难以控制的因素多,试验误差大,则显著水平应选的低一些,即 a 值取大些;反之对于试验的精确度要求较高,试验耗费较大,不允许反复,或试验结论的应用事关重大,则所选显著水平应高一些,即 a 值应该小些。显著水平 a 对统计假设测验的结论是有直接影响的,所以它应该在试验之前规定下来。一般农业试验中,常常采用 a =0.05 a =0.01 两个显著水平。

(三)测定误差的概率,并将之与规定的 a 相比较作出判断

  在0为正确的前提下,根据统计数的一定分布律(如样本平均数的抽样分布,样本平均数差数的抽样分布等),计算实得差异由误差造成的概率。如上述例题中 - m0 =-0.7% ,这个差异是由误差造成的还是由于处理之间本质不同造成,亦即判断无效假设是否正确,就必须测定误差的概率。

  通常如果因随机误差而得到该差数的概率 P>0.05 ,应该接受 0,推断实得 差异来源于误差,总体参数间无本质差异,或说否定 0尚证据不足 ;如因随机误差而得到该差数的概率 0.05 ≥ P>0.01 , 50.0=a水平上 否定 0,接受 HA 推断总体参数间差异显著 (significant) ;如因随机误差而得到该差数的概率 P ≤ 0.01 则在 10.0=a水平上否定 0 接受 HA,推断总体参数间的差异达到极显著 (very significant) 水平。所以统计假设测验也叫差异显著性测验。

  本例中,在无效假设正确的假定下,研究平均数的抽样分布,我们可认为从假设总体中抽取样本容量 n=50 的样本,其样本平均数分布 mx= m = m0 =14.5%,其假设总体的标准差未知,可以由样本的标准差 s=2.1% 估计。从假设的分布中计算 出现的概率,即出现随机误差 - m0 =-0.7% 的概率,由前面介绍的抽样分布可知,当样本容量 n>30 时,样本平均数分布具有正态分布的形状。根据 u 测验的公式有:

u=

综合上述,统计假设性测验的步骤如下:

  1、对样本所属总体参数提出假设,包括无效假设和备择假设。

  2、确定显著水平 a

  3 、在 0为正确的前提下,根据统计数的一定分布律,计算实得差异由误差造成的概率。

  4 、判断:将计算所得的误差概率与 a进行比较,作出接受还是否定无效假设 0的推断,并说明总体参数之间的差异是显著、极显著还是不显著。