统计学第11讲 单因素方差分析.ppt
第12章 连续变量的统计推断(二)单因素方差分析,12.1方差分析入门,12.1方差分析入门,12.1.1为什么要进行方差分析 12.1.2方法原理 12.1.3单因素方差分析的应用条件 12.1.4单因素方差分析的SPSS实现,12.1.1为什么要进行方差分析,在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异 方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如 医学界研究几种药物对某种疾病的疗效; 农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响 不同饲料对牲畜体重增长的效果等 都可以使用方差分析方法去解决,12.1.2方法原理,方差分析的相关概念: 上述农作物产量、广告效果等最终效果的变量被称为观测因素,或称为观测变量; 影响观测变量的因素称为控制因素,或者控制变量; 控制变量的不同类别,称为控制变量的不同水平。,12.1.2方法原理,方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些是对观测变量有显著影响的,其不同水平及各水平的搭配是如何影响观测变量的; 方差分析认为,影响观测变量值变化的有两类: 一类是控制变量的不同水平带来的影响; 一类是随机因素的影响,主要指抽样误差;,12.1.2方法原理,方差分析认为:如果观测变量在控制变量各个水平上波动大,则控制变量对观测变量有重大影响,波动不大则是随机因素造成的; 衡量是否产生明显波动是通过检验观测变量在控制变量各水平上的分布是否出现了显著差异来实现的,如果有差异就有波动,反之没有;,12.1.2方法原理,在下述条件下,可以将分布的差异变成均值的差异: 观测变量总体服从正态分布; 观测变量各总体方差应该相同; 总之,方差分析从观测变量的方差入手,检验均值是否显著差异,分析控制变量是否给观测变量显著影响,进而对控制变量各水平对观测变量影响程度进行分析; 方差分析可分为单因素、多因素方差和协方差分析,单因素方差分析的基本原理,单因素方差分析用来研究一个控制变量的各个水平是否对观测变量产生显著影响; 例子: 不同施肥量是否对农作物产量带来显著影响; 考察地区差异是否影响妇女生育率; 都可以通过单因素方差分析得到结论;,单因素方差分析的基本原理,例12.3 打开SPSS自带文件Cars.sav,其中变量mpg的含义为每加仑汽油可以行驶的里程数(简单理解为耗油量),现在希望比较产自美国,日本,欧洲的汽车,考察其每千米耗油量有无差异。,Cars.sav数据表,单因素方差分析的基本原理,该问题是考察产地这一因素的变化对汽车耗油量是否有显著性影响。因此,这个问题属于单因素方差分析。 通常把产地看作一个因素,记为A因素,它有3个不同水平记为A1,A2,A3. 耗油量称为试验指标,记为y,第 i 产地在第 j 次试验下的耗油量用yij表示。,单因素方差分析的基本原理,一般地,单因素方差分析问题是:设某个因素A有k个不同水平A1, ,Ak. 每个水平下重复进行ni次试验,得到ni(i=1,2, ,k)个试验指标。总样本量N=sum(ni) 问因素A的变化对试验指标y是否有显著性影响,单因素方差分析的基本原理,设 表示在水平Ai下试验指标y的真实平均值,则在Ai下每次试验结果yij应该是在真实平均值的左右随机波动,这个随机波动记为 方差分析模型为 诸 相互独立且 , , 为未知 研究因素的影响是否显著,归结为k个总体是否具有相同的均值,即检验假设:,单因素方差分析的基本原理,所有数据的偏差平方和 总平方和=组间平方和+组内平方和 组间平方和是由A发生变化引起的,反映总体均数之间的差异。 组内平方和是由随机因素引起的差异。,单因素方差分析的基本原理,理论上,SST 有自由度 n-1,SSB有自由度 k-1,SSW 有自由度 n-k,在正态分布的假设下, 如果各组均值相等(原假设),则统计量 服从自由度为 k-1 和n-k 的F 分布。对于给定样本, SST确定,如果原假设成立, SSB偏小,由分解知SSW偏大,故F偏小。,单因素方差分析的基本原理,反之,如果F偏大,在 SST确定的情形下,SSB偏大,由分解知SSW偏小,从而原假设不成立。因此可以使用F统计量来判断假设是否成立。 根据F分布计算p值:p=Sig.=P(FF值) 若palpha,拒绝原假设,认为因素A对试验指标有显著性影响。通常当p0.01时,称有非常的显著影响。,单因素方差分析的基本原理,方差分析中常常将所计算出的指标形成方差分析表(Analysis of Variance Table),12.1.3单因素方差分析的应用条件,可比性 若资料中各组均数本身不具可比性则不适用方差分析。 正态性 即偏态分布资料不适用方差分析。 对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。,12.1.3单因素方差分析的应用条件,方差齐性 即若组间方差不齐则不适用方差分析。 多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。,12.1.4单因素方差分析的SPSS实现,AnalyzeCompare Means One-Way ANOVA Dependent List:mpg Factor:origin Options: Descriptive:描述统计量 Homogeneity of Variance:方差齐次性检验 Mean Plot:均值分布图,12.1.4单因素方差分析的SPSS实现,方差齐性检验表明:p0.90,可认为样本所来自的总体满足方差齐性的要求。,12.1.4单因素方差分析的SPSS实现,由方差分析表知,F值远大于1,拒绝原假设,认为有显著影响。而p0.05,也表明了这点,即可认为各国汽车耗油量是不同的。,