上海财经大学应用统计学.ppt
《上海财经大学应用统计学.ppt》由会员分享,可在线阅读,更多相关《上海财经大学应用统计学.ppt(223页珍藏版)》请在三一文库上搜索。
1、应用统计学,管理科学与工程 学科综合水平考试,应用统计学考试大纲,考试要求: 经济管理中常用的基本统计原理和方法 熟悉统计计算方法和公式,并能正确地解释计算结果 初步具有应用定量的统计模型以及科学的统计方法进行现代化管理和决策的能力,应用统计学考试大纲(续),考试内容: 数据的整理与图形 常用随机变量的分布以及抽样分布 参数估计 假设检验 回归分析 时间序列分析 考试时间: 每年五月份第3个星期日下午,应用统计学教学进度表,应用统计学目录,第一章 数据的整理与图形-10 第一节 数据的整理与图形表示-12 一饼形图-18 二组距分组法与频率直方图-19 三条形图与柱状图-20 四并列条形图或柱
2、状图-21 五茎叶图-22 第二节 数据的描述性指标-18 一数据集中趋势的度量-24 二数据离散趋势的度量-25,应用统计学目录,第二章随机变量以及抽样分布-25 第一节 随机变量概念和随机变量的数字特征-12 一随机变量的数学期望-18 二随机变量的方差和标准差-19 第二节 常用随机变量以及分布-18 一01分布-24 二二项分布-25 三正态分布与标准正态分布-26 第三节 总体与样本-27 一总体-28 二样本-29 三. 联合分布函数和联合概率密度 -30,应用统计学目录,第二章常用随机变量的分布以及抽样分布-25 第四节 抽样方法-30 一简单随机抽样-31 二分层抽样-32 三
3、整群抽样-33 四系统抽样-34 第五节 样本统计量的分布-18 一统计量-35 二常用统计量-36 三三大分布( 卡方分布、t分布、F分)-37 四正态总体的样本均值和样本方差分布-38 五独立同分布的中心极限定理-40,应用统计学目录,第三章参数估计-41 第一节 参数的点估计-42 一参数点估计的一般提法-42 二参数点估计的求法-43 三点估计量的评价标准-44 第二节 参数的区间估计-44 一参数区间估计的一般提法-44 二单侧置信区间-45 三关于一个正态总体均值和方差的区间估计-46 四关于两个正态总体的均值差的区间估计-47 五关于比率p的区间估计-48,应用统计学目录,第四章
4、假设检验-51 第一节 假设检验的原理-42 一假设检验的基本思想-42 二原假设和备选假设-43 第二节 假设检验的基本概念-44 一两类错误-44 二显著性水平的确定-45 三原假设与备选假设的选择-46 四双侧检验与单侧检验-47 五假设检验的一般步骤-48,应用统计学目录,第四章假设检验-51 第三节 关于总体均值与方差的假设检验-52 一关于一个正态总体均值的假设检验-52 二关于一个正态总体方差的假设检验-53 三关于两个正态总体均值差的假设检验-54 四关于比率p的假设检验-55 五关于两个总体比率差的假设检验-56 第四节 假设检验与区间估计的关系-44,应用统计学目录,第五章
5、回归分析-62 第一节 简单线性回归分析-62 一散点图-62 二简单线性回归模型及基本理论假设-63 三简单线性回归模型的基本特征-66 四回归参数的最小二乘估计-67 五方差2的估计、可判定系数R2与相关系数R-68 六回归效果的显著性检验与方差分析表-69 七回归参数的假设检验与区间估计-70 八预测-71,应用统计学目录,第五章回归分析-61 第二节 多元线性回归分析-74 一多元线性回归模型及基本理论假设-74 二回归参数的最小二乘估计-75 三方差2的估计、复可判定系数R2 -76 四多元线性回归模型的假设检验-77 五估计与预测-78 六多项式回归模型-79,应用统计学目录,第五
6、章回归分析-61 第三节 线性回归模型的适宜性评价-81 一非线性-82 二异方差性-83 三序列相关性-84 四非正态性-85 五多重共线性-86,应用统计学目录,第六章时间序列分析-92 第一节 时间序列的组成因素-92 一影响时间序列的四个因素-92 二时间序列的三个分解模型-93 第二节 长期趋势的测定-96 一长期趋势的测定滑动平均法-97 二直线趋势的测定最小二乘法-98 三曲线趋势的测定-99,应用统计学目录,第六章时间序列分析-92 第三节 季节变动因素的测定-100 一按月(季)平均法-101 二滑动平均趋势剔除法-102 三季节调整-103 第四节 循环波动因素的测定-10
7、4 一剩余测定法-104 二循环波动相关数图-105,应用统计学希腊字母表,第一章 数据的整理与图形,第一节 数据的整理与图形表示 数据整理一般来说数据整理的一项初步工作是对数据进行统计分组。 统计分组一般按照数据的品质标志或数量标志分组。 不同的分组标志反映总体的不同特征,因此,必须从统计研究任务的需要出发,选择能够反映现象本质特征的标志。 品质标志从事物的性质或属性特征上区分各种类型组。如性别、颜色、产品等级、生产厂家等。 数量标志从事物的数量差异程度上来区分各种类型组。如温度、产量、年龄、销售量等。 频数分配在某统计分组内的数据个数称为该组的频数。 频率某组频数与全部组的频数之和的比值称
8、为该组的频率。 频率分布按数据的某种标志分组,把全部数据在各组中的分配状况称为频率分布。 频数频率分布表将分组标志、各组频数及频率列成表格。 反映总体的分布规律和性质,在定量统计分析中有广泛的用途。,第一节 数据的整理与图形表示,频数频率分布表标准样式:,一.饼形图,适用于分组数少 用于描述和表现各成分或某一成分占全部的百分比 各成分总和=100% 用圆代表全体,用扇形区域代表各成分,扇形区域面积占整个圆面积的百分比等于该成分占全部的百分比 例1.1 某公司工作人员的性别频数频率分布表如下:,二.组距分组法与频率直方图,数据标志取值个数较小(单项数列)采用品质分组法。例如5分制的学生成绩。 数
9、据标志取值个数较多或连续变量(组距数列)采用组距分组法(等距数列和异距数列)。例如百分制的学生成绩。 异距数列制作直方图时,要先计算出各组的频数密度=频数/组距,然后以组距为宽,以频数密度为高画直方图。 组距分组法(等距数列)的操作步骤如下: 例1.2 从一批电阻中抽取30只,测得各只电阻的电阻值如下表。对这组数据适当分组,并建立频数频分布表和绘制频率直方图。,二.组距分组法与频率直方图(续),第一步:找出最大值L,最小值l,计算极差R=L-l。本例中L=4.9, l=2.6,R=4.9-2.6=2.3。 第二步:确定分组个数k,计算组距h。分组个数一般由下表确定(根据美国统计学家斯特吉斯提出
10、的经验公式:组数=1+3.322LogN得出,其中N为数据个数)。本例选取k=5。则组距k=R/h=2.3/5=0.46,为计算方便可取h=0.5。,二.组距分组法与频率直方图(续),第三步:决定各组界限值,确定分点。第一组的下限值=l-h/2,上限值=l+h/2。本例中也可取第一组下限值为2.5,上限值为2.5+h=2.5+0.5=3;依此类推第五组下限值为4.5,上限值为5.0。 第四步:数出各组频数,计算频率,作出频数频率分布表如下。要特别注意:数据正好是界限值时,则该数据应被计数在以它为下限的组中。,二.组距分组法与频率直方图(续),第五步:由频数频率分布表可以画出频率直方图。 在平面
11、直角坐标系的横坐标X轴上标出各组界限值 在各组下限值与上限值之间画出高为该组频率的矩形 直方图的特点:简单、直观,能够反映数据是否呈对称分布,数据的平均水平及散布情况。,三.条形图与柱状图,条形图与柱状图本质上没有太大区别,都是用来对各项信息进行比较。主要区别: 数据是对事物在时间序列上的度量,一般用横坐标表示时间,这样可以直接地观察事物随时间变化的情况采用柱状图。 如果数据不是按时间排列的且各项信息的标识过长时采用条形图。 例1.3 某电视机生产厂家2006年市场占有率及其主要竞争对手的市场占有率资料如下表所示。请分别用条形图和柱状图表示该组数据。,三.条形图与柱状图(续),四.并列条形图或
12、并列柱状图,并列条形图或并列柱状图有利于对两组或两组以上的并列数据进行对比。(还有一种堆积条形图) 例1.4 某电视机生产厂家2005和2006年市场占有率及其主要竞争对手的市场占有率资料如下表所示。请用并列柱状图表示该组数据。,三.并列条形图或并列柱状图(续),三.茎叶图,茎叶图也是一种条形图,它是把每个数分成茎和叶两部分,同茎的数排成一列,然后按茎和叶的大小排列成图。一般取数据的最后一位数为叶,前几位数为茎。分为一般茎叶图和有序茎叶图。 茎叶图它直观地显示了数据所在的范围以及数据的总体水平(集中或分散情况),它的优点是可以清楚地看到落在每一直方形中的具体数据,而且可以较容易地找出有用的分位
13、数,如中位数等。 例1.5 某班级(40人)应用统计学期末考试成绩如下表所示。请画出茎叶图。,三.茎叶图(续),以十位数为茎,个位数为叶,画出的茎叶图如下:,三.茎叶图(续),还可以把各茎叶上的叶按大小排序,得到有序茎叶图如下:,第二节 数据的描述性指标,测定每个观察单位某项指标值的大小,所得的资料称为计量资料又称测量资料,这类资料一般具有计量单位。计量资料的统计指标分成两大类: 数据集中趋势的度量表达计量资料集中位置的指标,用以描述观察值的平均水平,如算术均值、几何均值、调和均值、中位数、众数、百分位数。 数据离散趋势的度量表达计量资料变异的指标,又称离散指标,用以描述观察值间参差别不齐的程
14、度,即离散度或称变异度,如全距、标准差、方差、标准误差、变异系数、四分位数间距等。 设原始观察值为 第 组频数(有时可以是出现的频率)记为 ,组中值记为,一.数据集中趋势的度量,表示数据的集中点或中心点。根据不同的实际需要,可以采用下列指标之一来对数据的集中趋势进行度量: 算术平均值简称为均值 总体均值用希腊字母 表示,样本均值用 表示。算术平均值的具体计算方法分为简单算术平均和加权算术平均两种: 简单算术平均 加权算术平均 算术平均值有两个重要的数学性质: 各个变量值与平均值离差之和等于零。 各个变量值与平均值的离差平方之和为最小值。,一.数据集中趋势的度量(续),中位数(或称中数) 中位数
15、用M表示,它将总体或样本的全部观察值分成两部分,每部分各有50%个观察值,其计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值为奇数时,处于中间的那个数为中位数。偶数时处于中间的两个数的均值为中位数。 中位数是位置平均值,它不受极端值的影响,在具有个别极大或极小值的分布数列中,中位数比算术平均值更具有代表性。,一.数据集中趋势的度量(续),众数 频数最大的变量值称为众数,列为频数表的资料,频数最大的组的组中值为众数。当数据个数较少时,众数就是出现次数最多的那个数据。 对于一组数据,众数可以不止一个,也可能没有众数。 适用于粗略地表示呈单峰分布资料的集中趋势
16、。,一.数据集中趋势的度量(续),百分位数 百分位数以 表示,它将总体或样本的全部观察值分成两个部分,其中有 个观察值小于 ,(100 )%个观察值大于 。如百分之25分位数或称第25百分位数,表示有25%个观察值小于 ;75%个观察值大于 。中位数就是百分之50分位数 。常用的有上四分位数 和下四分位数,一.数据集中趋势的度量(续),上四分位数的计算 将数据由小到大排列,记排列后的数据为 令: 其中 表示向上取整,如 。则上四分位数就是 ,即约有1/4的数据比 大,3/4的数据比比 小。,一.数据集中趋势的度量(续),下四分位数的计算 将数据由小到大排列,记排列后的数据为 令: 其中 表示向
17、上取整,如 。则下四分位数就是 ,即约有3/4的数据比 大,1/4的数据比比 小。,一.数据集中趋势的度量(续),例1.6 某班30名MBA学生的年龄按上升顺序排列如下表。请计算这组数据的众数、中数、平均数、上四分位数和下四分位数。 众数为27和28;分别出现5次 中数为(27+28)/2=27.5 平均数为27.67 上四分位数为x23=30,下四分位数x8=26,一.数据集中趋势的度量(续),中位数、众数、平均数的运用比较 中位数对极端值不像平均数那么敏感,因此对于有极端值的数据集来说,采用中位数描述其集中趋势一般比平均数更合适。 众数的主要缺点是可能没有众数或不惟一,而平均数和中数都是存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 上海财经大学 应用 统计学
链接地址:https://www.31doc.com/p-2633965.html