[解决方案]方差分析.doc
《[解决方案]方差分析.doc》由会员分享,可在线阅读,更多相关《[解决方案]方差分析.doc(44页珍藏版)》请在三一文库上搜索。
1、 第九章 方差分析第一节 方差分析的一般问题 一、方差分析的意义在工农业生产和科学研究中,经常要搞一些试验活动。比如,为了解某个新品种的种植效果,需要在土壤条件、温度、湿度、施肥、灌溉等因素相同的情况下,将新品种与其他同类品种的种植结果作比较。商品的包装方式和在商场里的摆放位置,对吸引顾客是有帮助的,那么为确定某商品合适的包装和销售位置,也可以进行观察试验。在化工生产中,原料的成分、反应温度、压力、时间、催化剂、设备水平、操作规程等,对产品的得率和质量有很大的影响,通过实验研究,可以帮助我们找到一个最优的生产方案。在试验基础上取得的数据,称为试验数据。方差分析技术是对试验数据进行分析的一种比较
2、有效的统计方法。方差分析是费暄在马铃薯种植试验中首先提出来的,当初他采用的处理方法是,把观察数据看作是马铃薯品种与试验误差共同影响的总和,然后把条件(马铃薯品种)变异和随机试验误差进行比较,以此分析马铃薯品种之间是否存在显著的差异。后来费暄给出的总结性意见是,方差分析是在若干个能够互相比较的资料组中,把产生变异的原因(主要是条件因素和随机因素)加以明确区分的方法和技术。二十世纪二十年代,费暄又对方差分析作了系统的研究,并把他的研究成果写在供研究人员用统计方法等著作中。关于单个总体均值和两总体均值差的检验内容,我们在前面已作了比较系统的介绍。从形式上看,方差分析把这一类检验问题向前拓展了一步,它
3、能够同时对若干个总体均值是否相等的假设进行检验,从而大大提高了统计分析的效率。另外,方差分析对样本的大小没有更多的限制。无论是大样本还是小样本,均可以使用方差分析方法。方差分析方法的最大好处在于,在资料分析过程中所带来的种种便利性,其一,它能够使资料的层次结构清晰有序,其二,它能把一切需要进行的假设检验归结成一种共同格式。有鉴于此,方差分析的思想逐渐渗透到统计学的许多方法之中。比如,我们在相关与回归分析一章中所述的总离差平方和的分解,实际上就是方差分析思想的应用。方差分析现在在许多学科领域都有重要的应用,其中比较典型的有:农业试验、工业生产、气象预报、医学、生物学、管理科学、教育学等。方差分析
4、是统计分析的基本工具之一,学习方差分析,重在领会它的统计思想和掌握其处理问题的基本手段。 二、有关术语及假定条件为使问题的表述更加方便,一般地我们把在不同条件下所作的试验的结果,称为试验指标,用Xij、Xijk来表示。影响试验结果的各种变化条件,称为试验因素,用A、B、C等表示。影响试验结果的条件往往有许多种类,但在一次试验中不可能都将它们考虑进来,总是根据人们关心的侧重点不同而有所选择,按选择的方式,有人为确定试验条件和随机确定试验条件之分。前一情况下的试验称为固定条件下的试验,对此采用的方差分析为固定效应模型,后一情况下的试验为随机条件下的试验,相应的是方差分析的随机效应模型。在这里,我们
5、主要讨论固定条件下方差分析的固定效应模型。每一试验条件在试验中所处的状态,称为试验水平,用A1,A2,Ar和B1,B2,Bs表示。在一次试验中,如果仅考虑一个试验条件而将其他因素相对固定的试验,称为单因素试验,对应单因素试验的方差分析,称之为单因素方差分析,依此类推,有两因素方差分析和多因素方差分析。例1.1 在电解铜工艺中,电流强度、电解液配方和浓度、设备水平等,对电解铜的纯度有很大影响。为考虑电流强度的作用效果,将其他因素固定起来,分别在五种电流强度下各作5次试验,观察一小时内得到的电解铜的杂质率数据为:表1.1 电解铜杂质率电流杂质率样品A1A2A3A4A5101520253011.72
6、.11.51.91.822.12.21.31.91.932.22.01.82.22.142.12.21.42.31.751.92.11.72.01.2本例中,杂质率为试验指标,试验条件为电流,分五种水平各作5次试验。所以,这是一个单因素五水平的固定效应方差分析问题。例1.2 一企业为推销某种产品在五个地区建立了销售点,统计的四个时期的销售量资料如表1.2所示:表1.2 销售量资料地点销售量时期B1B2B3B4B5A162448A210711912A3139787A421223试问该产品在不同地区和不同时期的销售情况是否存在显著的差异。在这个例子中,地区和时期可看作是试验的因素,地区取了5个水平
7、,时期取了4个水平,因此,这是一个两因素45水平的方差分析问题。方差分析的实质是变异分析,进行方差分析时,要注意考虑以下几个假定条件: 1、各因素水平下的观察值Xij或Xijk是随机变量,它能够分解成两个部分,一是个因素水平下的期望E(Xij)=j或E(Xijk)=ij,另一是随机误差项ij或ijk。因此有:Xij=j+ij,i=1,2,n,j=1,2,r (1.1)其中n为试验次数,r为因素水平数。Xijk=ij+ijk,i=1,2,r,j=1,2,s,k=1,2,l (1.2)其中r、s为因素水平数,l为试验次数。2、ij或ijk服从正态分布,且相互独立。理论上讲,随机误差对试验结果的效应
8、比试验条件效应要小,并且相互之间没有太大的差别,因此,假定试验误差服从正态分布是有一定道理可言的。3、假定E(ij)= 0、E(ijk)=0。这一假定容易得到满足,一旦它们不成立,只要把它们期望之中非零部分纳入j、ij中即可。在这一条件下应有E(Xij)=j或E(Xijk)=ij。4、假定Var(ij)=2,Var(ijk)=2。这一假定叫做方差齐一性假定,它是方差分析的重要前提。方差的齐一性假定往往不易得到满足,出现这样的情况时,要注意对试验的安排,以尽量减小对分析结论的干扰。在上述假定条件下,方差分析的数据结构模型可表述成:Xij N(j,2), i=1,2,n,j=1,2,r (1.3)
9、Xijk N(ij,2),i=1,2,n,j=1,2,rk=1,2,l (1.4) 三、方差分析的基本思想从表1.1中可以看出,通过试验获得的数据参差不齐,不仅在不同的电流强度下的数据是这样,就是在同一电流强度之下也是如此。做试验的目的,主要是为了观察研究试验因素对试验指标是否有显著的影响。如果试验因素对试验结果有显著性影响,那么就要考虑选择什么样的因素及其水平才比较合适,若是影响不显著,则从经济效益的角度,应该考虑低成本的生产方案。怎样才能知道试验因素对试验指标有没有影响呢?为此,我们可以进行这样的设想,在某一因素水平下的试验数据,由于试验条件基本相同,因而数据间的差异可看成是随机性误差引起
10、的,不同因素水平下的试验数据,由于试验条件的改变,它们的差异可看成主要是因试验条件而导致的。随机误差往往服从正态分布,因此,每一因素水平下的试验数据又可当作是来自于这一因素水平的总体的一个样本,理论上它们应该有一个均值j(j=1,2,r)。这样一来,因素影响是否显著就转化为,检验1,2,r是否相等的问题。随机误差用各因素水平下的数据变异指标方差来衡量,称之为组内方差,记作2w,条件影响的变异称为组间方差,记作2B,它们的样本估计量分别为S 2w和S2B。容易理解,如果试验因素水平的变化对试验指标的影响不大,则S2B与S2w应比较接近,它们的比值将趋向1,反之S 2B明显会比S 2w大,即有1。
11、据此,可用作为检验统计量。事实上,方差分析就是在前面的假定条件下,对假设H0:1=2=r,运用统计量进行检验的,并根据检验的结果,做出相应的判断结论。 四、方差分析的一般步骤进行方差分析一般要经过以下几个步骤:第一步,根据试验资料,检查方差分析的假定条件是否能够成立。第二步,建立方差分析的数据结构模型。第三步,提出检验假设。第四步,构造检验统计量。第五步,由试验资料计算检验统计量的值。第六步,在给定的显著性水平下,查出临界值,作出比较判断。第二节 单因素方差分析 一、单因素等重复方差分析假定试验中只考虑一个因素A,共作了A1,A2,Ar这r个水平的观察,每个水平Aj为正态总体N(j,2),j=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解决方案 方差分析
链接地址:https://www.31doc.com/p-1990450.html