832-Spss统计应用实务-问卷分析与应用统计.ppt
《832-Spss统计应用实务-问卷分析与应用统计.ppt》由会员分享,可在线阅读,更多相关《832-Spss统计应用实务-问卷分析与应用统计.ppt(114页珍藏版)》请在三一文库上搜索。
1、Spss统计应用实务-问卷分析与应用统计,主要内容,统计基本原理与常用统计方法 统计基本思想及基本概念 统计数据整理与显示方法 统计描述 统计推断-参数估计假设检验 多变量关系研究-相关与回归,单(双)因素方差分析 常用的统计模型:因子分析、聚类分析 定量研究与统计分析 量化研究的基本概念 量表分析步骤 数据的建立 量表项目分析 量表效度与信度 信度与效度的概念 信度与效度的检验方法 统计应用实例及EXCEL、Spss,统计基本原理与常用统计方法 1.1统计基本思想与基本概念,1.1.1 什么是统计学?统计学是用以(1)收集数据、(2)分析数据、(3)由数据得出结论的一组概念、原则和方法。 1
2、.1.2 统计学的基本思想 随机性和规律性:关系密切的孪生子 规律性中的随机性 1.1.3 统计学的中几个基本概念 变量、值和个体 定义: 分类:定类变量、定序变量、定距变量、定比变量 随机事件和随机变量 总体、样本 总体参数和样本统计量 概率,统计基本原理与常用统计方法 1.1统计学的基本思想与基本概念,1.1.4 统计研究的基本过程 数据收集-数据整理-数据分析 1.1.5 数据收集 观测数据和实验数据 变量的定义和变量的选择 数据收集的方法:文献资料法、调查法、测量等 选择合适的样本:简单的随机抽样、分层抽样、整群抽样 收集数据时的错误和误差 衡量某一调查的结果所要考查的因素: 样本是否
3、是合适的样本 响应率(response rate) 提问题时所用的实际措辞 在调查中该问题被安排在什么地方? 访问员是谁 抽样误差(sample error)、系统误差、过失误差、随机误差 未响应误差(nonresponse error) 响应误差(response error),统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,1.2.1 数据的分类 定类变量-分类数据 定序变量-顺序数据 定距变量-数值型数据 时间序列数据 多变量数据 1.2.2分类数据的整理与展示 频数与频数分布 图示:条型图、饼图,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,1.2.3顺序
4、数据的整理与展示 累积频数 累积频率,【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意? 1非常不满意;2不满意;3一般;4满意;5非常满意。,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,甲城市家庭对住房状况评价的累积频数分布,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,1.2.4数值型数据整理与展示方法 数据的分组,分组方法,分组方法,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,统计基本原理与常用统
5、计方法 1.2不同数据类型整理与展示方法,组距分组 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数 统计出各组的频数并整理成频数分布表,实例,用Excel制作频数分布表,【例】某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组。,直方图,某电脑公司销售量分布的直方图,折线图,折线图与直方图 下的面积相等!,140,150,210,某电脑公司销售量分布的折线图,190,200,180,160,170,22
6、0,230,240,茎叶图,箱线图,不同数据分布的箱线图,不同分布的箱线图,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,1.2.5时间序列数据-线图,【例】已知19912000年我国城乡居民家庭的人均收入数据如表。试绘制线图,线图,统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法,1.2.5多变量数据-雷达图,【例】2000年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图。,今天的主食是面包,雷达图,总结,统计基本原理与常用统计方法 1.3描述统计,1.3.1数据集中趋势测度指标 众数(Mode) 中位数(Median)、分位数(quartil
7、e) 平均数(Mean) 1.3.2数据离散趋势测度指标 异众比率 全距(Range) 四分位距(quartile deviation) 标准差(Std.deviation) 方差(Variance) 变异系数(离散系数) 1.3.4数据偏态与峰态测度指标 偏态系数、峰态系数 1.3.5相对位置测量 标准分,众数、中位数、平均数与分布,众数、中位数、平均数的特点和应用,众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用,相对位置-标准分,经验法则表明:当一组数
8、据对称分布时 约有68%的数据在平均数加减1个标准差的范围之内 约有95%的数据在平均数加减2个标准差的范围之内 约有99%的数据在平均数加减3个标准差的范围之内,应用标准分制定评价标准,偏态与峰态分布的形状,偏态,峰态,EXCEL统计实例,统计基本原理与常用统计方法 1.4统计推断,1.4.1抽样与抽样分布 1.4.2参数估计 1.4.3假设检验,统计推断的过程,统计基本原理与常用统计方法 1.4统计推断,1.4.1抽样与抽样分布 抽样方式,统计基本原理与常用统计方法 1.4统计推断,1.4.1抽样与抽样分布 抽样分布,在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布
9、或概率分布 是一种理论分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布示意,统计基本原理与常用统计方法 1.4统计推断,1.4.1抽样与抽样分布 样本均值的抽样分布, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,统计基本原理与常用统计方法 1.4统计推断,1.4.1抽样与抽样分布 样本均值的抽样分布, 计算出各样本的均值,如下表。并给出样本均值的抽样分布,统计基本原理与常用统计方法 1.4统计推断,1.4
10、.1抽样与抽样分布 样本均值的抽样分布, = 2.5 2 =1.25,总体分布,中心极限定理,中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,统计基本原理与常用统计方法 1.4统计推断,1.4.2参数估计 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量,统计基本原理与常用统计方法 1.4统计推断,由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,
11、我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,置信区间实例,一个由大学四年级男生组成的样本中,平均身高是71英寸,标准差是2.1英寸。用这组数据的构造的总体平均身高的95%的置信区间是70.4英寸71.6英寸之间。美国成年男的身高的均值是69.1英寸,你如何理解这个置信区间?从这个置信区间来看,大学四年级男生的身高和所有男性身高是否有区别? 【例】某种零件的长度服从正态分布,从某天生产一批零件中按重复抽样方法随机
12、抽取9个,测得其平均长度为21.4cm。已知总体标准差为=0.15cm。试估计该批零件平均长度的置信区间,置信水平为95%,统计基本原理与常用统计方法 1.4统计推断,解:已知:= 0.15cm,n=9,x=21.4,1-=95%,即:21.40.098=(21.302,21.498),该批零件平均长度的置信区间为21.302cm21.498cm之间,统计基本原理与常用统计方法 1.4统计推断,1.4.3假设检验 假设检验的基本原理 某种带有概率性质的反证法,即:小概率事件在一次观察中实际上不可能发生的统计原则。 假设 备择假设与原假设 所犯的两种错误及显著性水平 1 “弃真”错误 2 “取伪
13、”错误 统计量及拒绝域 基本步骤 1 提出原假设H0 2 选择计算统计量 3 取a=0.05或0.01并计算临界值 4 比较判断得出结论 单侧检验与双侧检验,什么是假设? (hypothesis), 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为这种新药的疗效比原有的药物更有效!,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理,原假设 (null hypothesis),研究者想收集证据予以反对的假
14、设 又称“0假设” 总是有符号 , 或 4. 表示为 H0 H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm,研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或 表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 : 10cm,或 10cm,备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常
15、的原假设和备择假设,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 500,500g,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 832 Spss 统计 应用 实务 问卷 分析
链接地址:https://www.31doc.com/p-3024664.html