[数学]第五章 方差分析.doc
《[数学]第五章 方差分析.doc》由会员分享,可在线阅读,更多相关《[数学]第五章 方差分析.doc(31页珍藏版)》请在三一文库上搜索。
1、第五章 方差分析统计假设测验只适用于单个样本或两个样本。当样本个数k3时,则需要采用另一种统计分析方法,即方差分析。第一节 方差分析基础(基本原理) 假设有k个样本(组),每个组(样本)有n个观察值,则经过初步整理的数据形式如表5.1。表5.1 kn数据结构表组别(样本)观察值和平均123jn123ik一、自由度和平方和的分解 (平均数的第一条性质) 同理有: 以上各式等号左右两边分别相加,得: 上式一般表示为: 其中表示总平方和,由观察值之间的差异而引起的变异;表示组间平方和或样本间平方和,是由组间或样本间的不同而引起的变异;表示组内平方和,是由相同的组或样本内的不同观察值间的差异而引起的变
2、异,由于相同的组或样本处于相同的条件下,因此组内平方和实际上表示由随机误差引起的变异,所以组内平方和又称误差平方和。这种将总的平方和分解成组间平方和与误差平方和的过程和方法称为平方和的分解,随着变异来源的进一步增加,还可以分解成不同的部分。在平方和的分解式子中,各部分的计算公式如下: 则需要指出的是,在组间平方和中除了组间固有的差异引起的变异外,还包含有随机误差引起的变异在内。与平方和的分解相对应,自由度也分解成相应的部分,即:,其中,而。平方和和自由度分解的目的是为了计算相应的均方,根据南均方的概念和定义,即有: ,其中表示总的变异程度大小,也可用表示;一般表示由处理效应和随机误差共同引起的
3、变异程度大小,也可用表示;表示单纯由随机误差引起的变异程度大小,也可表示。例5.1 设有三个葡萄品种,随机抽样,每品种各测定5株的单株果重,问品种间的单株果重有无显著差异?表5.1.1 葡萄不同品种单株果重()品种单 株 果 重和平均甲1161286438.6乙12162113167815.6丙1312836428.416310.9解:(1)自由度和平方和的分解 二、F测验在一个平均数为,方差为2的正态总体中,随机抽取两个独立样本,分别求得其均方和,将和的比值定义为F,即: 此F值具有的自由度df1和的自由度df2。如果在给定的df1和df2下按上述方法从正态总体中进行一系列抽样,就可得到一系
4、列的F值而构成一个F分布。其分布曲线如图5.1:从图5.1中可以看出,F分布具有如下特征:1. F分布是具有平均数和取值区间为0,的一组曲线;2. F分布某一特定曲线的形状仅决定于参数和;3. 在或时,曲线呈反向J型,而,曲线呈偏态。F分布某一特定区间的概率可以从统计表中查出。从本课程教材P361附表5中可以查出在=0.05和=0.01的F临界值(需注意的是,附表5属一尾概率表)。在试验结果中,由于处理间均方内还包含有部分误差均方所引起变异,总体方差也一样,因此只有处理间总体方差大于误差总体方差时才能确定处理间有真实差异存在。要判断处理间有没有真实差异,需要经过F测验( ,)来确定。,然后根据
5、dft和dfe查F临界值表得F0.05和F0.01,然后进行比较。当FF0.01时,表示处理间方差极显著大于误差方差,此时处理间有极显著差异存在,此时在F值的右上角标上两个“*” ;当F0.01FF0.05时,表示处理间方差显著大于误差方差,处理间有显著差异存在,此时在F值的右上角标上一个“*”;当FF0.05时,表示处理间方差和误差方差相同,处理间没有显著差异,即处理间的差异完全由随机误差所引起,此时在F值的右上角不标任何符号。根据比较结果,一般要求列出方差分析表,其基本形式如下表。表5.2 方差分析表变异来源平方和自由度均方FF0.05F0.01样本间FF0.05F0.01误差例如例5.1
6、的F测验如下: (2) F测验表5.1.2 葡萄不同品种单株果重方差分析表变异来源SSdfs2FF0.05F0.01品种间168.1333284.0676.74*3.896.93误差149.60001212.467 结果表明,不同品种间的单株果重有显著差异。当F测验有显著或极显著差异时,仅表示样本(处理)间在整体上有差异,但这种差异到底来自于哪些样本(处理)间,在此并不清楚,需要进行多重比较以明确产生差异的具体原因。三、多重比较 即样本(处理)间的两两比较,其目的是分析样本(处理)间产生差异的具体原因。(一)、最小显著差数法(LSD法) 最小显著差数法的实质是t测验,其测验步骤如下: 1. 计
7、算平均数差数标准误 当时,则 2. 计算最小显著差数()当时接受HA,即 则,即 其中t通过误差自由度dfe查附表4获得。3. 进行平均数差数的比较 按样本(处理)平均数从大到小排列,列梯形表计算平均数差数的绝对值,然后分别以和为标准进行比较。当时,表明两个样本(处理)间差异极显著,在相应差值的右上角标上两个“*” ;当时,表明差异显著,在相应差值的右上角标上一个“*” ;当时,表明差异不显著,在相应差值的右上角不标任何符号。 如例5.1的LSD法比较过程如下:(3) 则 表5.1.3 葡萄不同品种单株果重差异显著性比较品种-8.4-8.6乙15.67.2*7.0*甲8.60.2丙8.4 表5
8、.4结果表明,甲和乙、乙和丙品种的单株果重间有极显著差异,而甲和丙两品种间没有显著差异。由于最小显著差数法的实质是t测验,而t测验最多只能用于两个样本(处理)的比较,当样本数(处理数)k3时,该法的标准较低,易犯第一类错误,因此难以保证试验结果的可靠性。但如果每一个样本(处理)只需与对照进行比较,而样本(处理)间不需进行比较时,可以采用此法。(二)、新复极差法(SSR法)该法在不同样本(处理)间采用不同的比较标准,可以用于多个样本(处理)间的两两相互比较。其基本步骤如下:1. 计算标准误(SE) 2. 计算最小显著极差 ,即 其中SSR0.05和SSR0.01均根据误差自由度dfe查教材P37
9、1附表8查得(其中秩次距p从2一直取到和k相同)。3. 进行平均数差异显著性比较 同LSD法一样列梯形表,计算样本(处理)平均数两两间的差数的绝对值,然后进行比较。同样,当时,表明两个样本(处理)间差异极显著,在相应差值的右上角标上两个“*” ;当时,表明差异显著,在相应差值的右上角标上一个“*” ;当时,表明差异不显著,在相应差值的右上角不标任何符号。 如例5.1的SSR法比较过程如下:(3) 根据计算出表5.1.4。表5.1.4 葡萄不同品种单株果重比较LSR值PSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.876.8333.234.555.107.19 表
10、5.1.5 葡萄不同品种单株果重差异显著性比较品种-8.4-8.6乙15.67.2*7.0*甲8.60.2丙8.4 表5.1.5结果表明,甲和乙、乙和丙品种的单株果重间有极显著差异,而甲和丙两品种间没有显著差异。(三)、q法该法的测验步骤与SSR法相同,其区别在于计算LSR时根据误差自由度dfe查教材P368附表7。其中:,即 如例5.1的q法测验过程如下:表5.1.6 葡萄不同品种单株果重比较LSR值Pq0.05q0.01LSR0.05LSR0.0123.084.324.876.8333.775.055.967.98 表5.1.7 葡萄不同品种单株果重差异显著性比较品种-8.4-8.6乙15
11、.67.2*7.0*甲8.60.2丙8.4 表5.1.7结果表明,甲和乙的单株果重间有显著差异差异,乙和丙品种有极显著差异,而甲和丙两品种间没有显著差异。从以上分析过程和结果可以看出,在LSD法、SSR法和q法三种测验方法的比较中,当k=2时,三种方法的测验精度相同,并且只需F测验即可得出结论;当k3时,三种方法的测验精度不同,其中LSD法最低,只适用于每个样本(处理)分别只与对照的比较,而q法精度最高,SSR法居中。在具体的试验中应根据试验的目的和要求选用合适的方法,在田间试验中,由于试验结果受环境因素的干扰较大,误差较大,因此大多数均采用SSR法进行多重比较。四、多重比较结果的表示方法(一
12、)、列梯形表法该法如表5.1.3、表5.1.5、表5.1.7,根据“*”的有无和“*”数量的多少来分析判断有没有显著差异或差异显著性的程度,比较直观,但所占篇幅较大,在样本(处理)数较多时不宜采用。(二)、划线法按平均数的大小从小到大将所有样本(处理)进行横向排列。凡是差异不显著的,则在相应的样本(处理)正面划一条直线连接,而差异显著的,则不用直线连接。例子见教材P107。该法直观,简单方便,但不能用于样本(处理)较多时的表示。(三)、标记字母法该法是目前科技文章中最常用的一种方法。在应用时,用小写字母a、b、c、等表示=0.05的水平,而用大写字母A、B、C、表示=0.01的水平。操作过程如
13、下:1. 将全部样本(处理)按平均数的大小从大到小依次纵向排列;2. 在0.05水平下,在第一个样本(处理)后面标上小写字母a;3. 将该样本(处理)的平均数依次与其后面的平均数进行比较,差异不显著时标上相同的字母a,再与下一个样本(处理)的平均数进行比较,依次进行,差异不显著的都标上相同的字母a,一直到有显著差异为止并返回。此时与第一个样本(处理)平均数没有显著差异的亲本(处理)后面暂时不标字母。4. 然后以第二个样本(处理)后面标上小写字母b,并以其为标准依次与下面的样本(处理)的平均数进行比较,差异不显著的都标上相同的字母b,到差异显著的样本(处理)时不标字母并返回再以第三个样本(处理)
14、标c开始,再依次进行比较,一直到最后一个样本(处理)后面标上字母(最后一个样本(处理)后面只有一个字母)为止。5. =0.01的水平和=0.05的水平字母标记的方法相同,区别在于前者是用大写字母而后者用小写字母,同时前者是以极显著为标准而后者用显著作为标准。字母标完后,根据有没有相同的字母来分析判断样本(处理)间的差异显著性,有相同小写写字母的样本(处理)间没有显著差异,没有相同大写字母的样本(处理)间有极显著差异,而没有相同小写字母而有相同大写字母的样本(处理)间有显著差异。字母的标记最好是在有差异显著性结果的梯形表的基础上进行,否则要兼顾比较分析和标记字母就很容易出错。如下面两个表格中的结
15、果。表5.1.8 水稻不同药剂处理苗高差异显著性(SSR法)药剂苗高()-14-18-23D2915*11*6*B239*5*A184C14表5.1.9 水稻不同药剂处理苗高差异显著性(SSR法)药剂苗高(cm)差异显著性5%1%D29aAB23bABA18 c BCC14 c C另外,如果有梯形表的差异显著性结果,则可用计个数的方法来标记字母。该法基于规范的梯形表。方法是某一字母所需标记的个数是梯形表中不带“*”(在=0.01水平上为“*”)的差值个数加1。在以标记字母法表示多重比较结果时,要求所标字母要简练,即的所用的字母数越少越好,按以上方法所标记的字母,可能需要进一步的精简处理,其方法
16、如下:1. 除第一样本(处理)和最后一个样本(处理)外,其余样本(处理)后的某一个字母若在纵向上只出现一次并且在横向上其前面还有它字母时,则该字母可以去除;2. 如果某一个字母所代表的差异显著性完全可以由其前面的某一个字母表示,则该字母可以省略;3. 最后一个处理中多于一个的字母全部去除。某一个字母精简后,其后的字母按顺序向前提升以保证字母的连续性。第二节 完全随机设计试验资料的方差分析一、单因素试验(单向分组资料)(一)、处理间重复次数相等的方差分析 详见本章第一节,在此不赘述。(二)、处理单果重复交粶相等的方差分析1. 自由度和平方和的分解特点 2. 多重比较特点 例5.2 今调查元帅苹果
17、短枝型1号、2号和普通型、小老树枝条节间的平均长度,期货结果如表5.2.1,试比较其差异显著性。表5.2.1 元帅苹果不同类型树枝条节间长度类型枝 条 节 间 长 度 (cm)总和平均短枝型1号1.81.81.71.91.71.810.71.78短枝型2号1.61.81.81.91.99.01.80普通型2.42.42.22.12.42.313.82.30小老树1.51.41.71.46.01.5039.51.88解:(1)自由度和平方和的分解 (2)F测验表5.2.2 元帅不同类型树枝条节间长度方差分析表变异来源SSdfs2FF0.05F0.01类型间1.724130.574742.89*3
18、.205.18误差0.2283170.0134 结果表明,不同类型树枝条节间长度间有极显著差异。(3)多重比较 表5.2.3 元帅不同类型树枝条节间长度比较LSR值PSSR0.05SSR0.01LSR0.05LSR0.0122.984.100.1520.20933.134.300.1600.21943.224.410.1640.225表5.2.5 元帅不同类型树枝条节间长度差异显著性(SSR法)类型节间长度(cm)差异显著性5%1%普通型2.30aA短枝型2号1.80bB短枝型1号1.78bB小老树1.50cC表5.2.4 元帅不同类型树枝条节间长度差异显著性(SSR法)类型节间长度()-1.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 数学第五章 方差分析 第五
链接地址:https://www.31doc.com/p-1983877.html