欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载  

    贵州财经学院数学与统计学院.PPT

    • 资源ID:2573980       资源大小:1.39MB        全文页数:102页
    • 资源格式: PPT        下载积分:10
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要10
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    贵州财经学院数学与统计学院.PPT

    ,贵州财经学院数学与统计学院,第三章 统计描述,第一节 统计表与统计图,第二节 分布的集中趋势,第三节 分布的离中趋势,第三章 统计描述,1、掌握统计资料的两种基本表达方法:统计表和统计图,2、理解和领会平均数的概念及其特点,掌握平均数各种计算方法的概念及计算公式,3、区分算术平均数与强度相对数的不同,4、离散趋势指标的计算是本章的又一重点,应该在理解的基础上掌握标准差的计算公式, 、 掌握标准差系数的意义、计算及应用条件,6 、分析平均数、中位数与众数之间的关系以及相互之间的推算,学习目标,第一节 统计表与统计图,统计表的概念:对统计调查所获得的原始资料进行整理,得到的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格,如调查表、汇总表或整理表等。本节所讲的统计表是狭义的统计表,即将汇总结果按一定顺序排列在由横行、纵列交叉结合而成的表格中,这种表现统计资料的表格称为统计表,一、统计表,(一)统计表的定义和结构,第三章 统计描述,统计表的结构:,1、从表式上看,统计表是由纵横交叉的线条组成的一种表格,包括总标题、横行标题、纵栏标题和指标数值四个部分。总标题是统计表的名称,它扼要地说明该表的基本内容。它置于统计表格的正上方。横行标题是横行的名称,一般位于表格的左方。纵栏标题是纵栏的名称,一般位于表格的上方。指标数值列在横行和纵栏的交叉处,用来说明总体及其组成部分的数量特征,它是统计表格的核心部分。,2、从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。,我国2002年国内生产总值,纵栏标题,数 字 资 料,主 词,宾 词,横行 标 题,总标题,(3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。,(二)统计表的分类,1、按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。,(1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。,(2)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表。,2、按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等。,(1)宾词简单排列 宾词不进行任何分组,按一定顺序排列在统计表上。,(2)宾词分组平行排列 宾词栏中各分组标志彼此分开,平行排列。,(3)宾词分组层叠排列 统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积。,(三)统计表的设计,统计表设计总的要求是:简练、明确、实用、美观、便于比较。,(1)线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。两端一般不划线,采用“开口式”。,(2)合计栏的设置。统计表各纵列若需合计时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最后一栏。,(3)标题设计 统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。,(4)指标数值 表中数字应该填写整齐,对准位数。当数字小且可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“ ” ;不应有数字时用符号“”表示。,(5)计量单位 统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。,(6)注解或资料来源 必要时,在统计表下应加注解或说明,以便查考。,首先建立直角坐标系,横轴代表分组变量,纵轴表示频数或频率。以各组距为宽,各组的频数或频率为高,绘制代表各组的直方块,便形成直方图。,15,12,9,6,3,统计图:统计图是借助几何图形或具体形象来 显示统计数据的一种形式。,(一)直方图,二、统计图,(二)折线图 也称多边形图,是在直方图的基础上绘制的。,15,12,9,6,3,105,110,115,120,125,130,135,140,频 数 (人),将每个直方块的顶端中点,即组中值画一个小圆点,然后将这些小圆点用直线相连,即形成折线图。起点通常放在距左边最低组半个组距的横轴上,终点通常放在距右边最高组半个组距的横轴上。,(三)曲线图 当变量数列的组数无限时,折线便表现为一条平滑曲线。 曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。,频 数 (人),15,12,9,6,3,(四)累计曲线图 累计曲线图的绘制。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上累计还是向下累计均以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计曲线。对于向下累计频数分布图,在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向下累计分布曲线图。,钟形分布的特征是“两头小,中间大”,即中间的变量值分布的次数多,靠近两边的变量分布的次数少,其曲线图宛如一口古钟。,三、频(次)数分布图的类型,主要有以下三种类型:,(一)钟形分布,U型分布的形状与钟 形分布相反,靠近中间的 变量值分布次数少,靠近 两端的变量值分布次数多, 形成“两头大,中间小”的U 型分布。,(二)U型分布,J型分布有两种类型,一种是次数随着变量的增大而增多,另一种是成反J型分布,其次数随着变量的增大而减少。,(三)J型分布,第二节 分布的集中趋势,(一)平均指标含义,一、描述分布集中趋势的主要指标及其分类,(二)平均指标的特点具有代表性和抽象性。,概括地描述统计分布的一般水平或集中趋势的数值。,4、分析现象之间的依存关系。,(三)平均指标的作用,统计平均数具有重要作用,主要体现在以下几点:,1、反映总体各变量分布的集中趋势和一般水平。,2、便于比较同类现象在不同单位间的发展水平。,3、能够比较同类现象在不同时间的发展变化趋势或规律。,位置平均数 根据标志值某一特点位置来确定的平均数。它不是对统计数列中所有各项数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。,(四)平均数的分类,平均数根据其具体的代表意义和计算方式不同,可分为:,数值平均数 是以统计数列的所有各项数据来 计算的平均数。其特点是统计数列中任何一项数据的 变动,都会在一定程度上影响数值平均数的计算结果。,众数 中位数,平均数,位置平均数,数值平均数,算术平均数 调和平均数 几何平均数 幂平均数,二、数值平均数,总体单位数: 表示的是一个总体内所包含的总体单位数。 在上面计算公式中,总体标志总量必须是总体各单位标志值的总和,标志值和单位之间存在一一对应关系。,数值平均数是对总体各单位某一标志值的平均,表明总体单位标志值的一般水平。,基本计算公式是: 总体标志总量/总体单位数。,总体标志总量: 总体各单位某种数量标志值的总和。,公式中,,(一)算术平均数,1、算术平均数的计算,计算算术平均数有两种式:,(1)简单算术平均数 适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。 计算公式为:,代表算术平均数。,表示各单位标志值。,表示总体单位数。,5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:,例,根据单项数列计算加权算术平均数,计算公式:,应用条件:单项式分组,各组次数不同。,(2)加权算术平均数,例:,某车间20名工人加工某种零件资料:,根据组距数列计算加权算术平均数,应用条件:组距式分组,各组次数不同。,例:某车间200名工人日产量资料:,权数在平均数中的权衡轻重的作用,是直接通过各组单位数占总体单位数的比重,也就是各组的频率相对数的大小体现出来的。频率的大,2、权数,(1)概念,对平均数的大小起着权衡轻重的作用。平均数总是趋向于出现次数最多的哪个标志值。,(2)权数的表现形式,绝对数形式 相对数形式,(3)权数的作用,当各组的次数都相同时,各标志值对平均数的影响都相同时,那就无所谓权数的“权衡轻重”了。 在这种情况下,加权算术平均数就等,小体现出来的。频率的大小就直接表明了该组标志值在平均数中占据的地位,频率越大,该标志值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,该标志值计入平均数的份额就越小,对平均数的影响就越小,这就是权数权衡轻重作用的实质。,(4)权数不起作用的场合,可以说,简单算术平均数实际上是加权算术 平均数的特例。,于简单算术平均数。,即当,时,,一般说来,次数就是权数,但在计算相对指标的平均数时,经常遇到次数不是权数的情况。故在求相对指标的平均数时,应根据相对指标的含义选择适当的权数。,(5)权数的选择,(6)由比重权数计算加权算术平均数,例,应用条件:已知的是比重权数(次数是比重),公式:,4、根据相对数(平均数)计算的加权,某局所属的三个企业的资料:,(1)根据相对数计算的,(2)根据平均数计算的,某企业各班组工人劳动生产率资料:,3、是非标志的平均数,是非标志:也称交替标志,当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况时,这种品质标志就称为是非标志。,平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。,例:某工厂生产某种产品合格率为95%,不 合格率为5%,求是非标志平均数。,4、算术平均数的数学性质,(2)各个变量值与其平均数离差平方之和为最小值,(1)各个变量值与其平均数离差之和等于零,(3)给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。,(4)给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。,(二)调和平均数(H),是社会经济统计中常用的另一种平均指标,它是根据标志值的倒数计算的,所以又称倒数平均数。与算术平均数一样,调和平均数有简单调和平均数和加权调和平均数两种。,例:一个人步行两里,走第一里时速度为每小时候 10里,走第二里时为每小时20里,则平均速度为:,应用条件:资料未分组,各个变量值次数都是1。,计算公式:,1、简单调和平均数,2、加权调和平均数,计算公式:,例1:,应用条件:资料经过分组,各组次数不同。,例2,调和平均数的应用,计算该企业该日全部工人的平均日产量。,即该企业该日全部工人的平均日产量为12.1375件。,是另一种形式的平均数,是N 个变量值乘积的 N 次方根。主要用于计算平均比率和平均速度。几何平均数也有简单几何平均数和加权几何平均数两种。,(三)几何平均数(G),1、简单几何平均数,例:某企业生产某种产品需经过三个连续作业车间才能完成。,应用条件:资料未分组(各变量值次数都是1)。,计算公式:,2、加权几何平均数,计算公式:,例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率,设本金为,应用条件:资料经过分组,各组次数不同。,平均年利率=8.77%,课练某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,该流水线产品平均合格率为:,几何平均数的计算方法,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为,应采用加权算术平均数公式计算,即,【课练】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:,第12年末的本利和为:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解:,三、位置平均数,(一)众数,1、众数的含义:总体中出现次数最多、频率最高的标志值。,2、确定众数的方法。,(1)单项数列确定众数,(2)由组距数列确定众数,1、计算公式:,例:,农户年人均收入众数计算表,(二)中位数,1、中位数的含义 将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数就是中位数。,2、确定中位数的方法,(1)由未分组资料确定中位数,中位数的作用:,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,标志值的个数是奇数,中位数的位次为:,即第3个单位的标志值就是中位数,标志值的个数是偶数,中位数的位次为,中位数应为第3和第4个单位标志值的算术平均数,即,(2)由单项数列确定中位数,例: 中位数为第40 名和41名日产量的平均值,众数的确定,(组距数列),计算该车间工人月产量的众数。,【例】某企业某日工人的日产量资料如下:,中位数的位次:,计算该企业该日全部工人日产量的中位数。,(3)由组距数列确定中位数,计算公式,例,(1)计算累计次数 (2)确定中位数组(67) (3)根据中位数计算公式计算中位数,中位数位次:,【课练】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,(三)众数、中位数、和算术平均数和的关系,对称分布,左偏分布,右偏分布,众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:,第三节 分布的离中趋势,一、描述分布离中趋势的主要变异指标及其作用,变异指标是用来刻画总体分布的离散程度或变异状况,变异指标越大,表明总体各单位标志值的变异程度越大。它是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。,变异指标的含义,常见的变异指标有:,极差,四分位差,方差,变异系数,标准差,2、反映社会经济活动的均衡性。,变异指标的作用,1、用于衡量平均指标的代表性。,3、研究总体标志值分布偏离正态的情况。,极差也称全距,用R表示,二、极差与四分位差,极差,公式: R =最大值最小值,【例】某季度某工业公司18个工业企业产值计划完成情况如下:,优点:计算简便,易懂,缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差,往往应用于生产过程的质量控制中,四分位差,用Q1代表第一个四分位数(下四分位数) , Q3代表第三个四分位数(上四分位数),四分位数,通过三个点将全部数据分为四个部分,每部分包含25%的数据,处在分位点上的数值就是四分位数。很显然中间的四分位数就是中位数,因此通常所说的四分位数是指第一个四分位数(下四分位数)和第三个四分位数(上四分位数)。,也称内距或四分间距,它是上四分位数与下四分位数之差,用Q.D表示,四分位差,Q.D=Q3-Q1,四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中,数值越大,说明中间的数据越分散。四分位差不受极值的影响,主要用于测度顺序数据的离散程度。,三、方差与标准差,是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;它是测度数值型数据离散程度的最主要方法。,标准差的平方,标准差,方差:,计算公式,资料未分组,资料已分组,例 1 某车间5名工人生产零件的日产量(件)分别为20、22、23、24、26,试计算其方差及标准差,,某车间5名工人日产量,例2,某企业加工车间200名工人日产量(件)资料如下表所示,,某加工车间200名工人日产量,【课练】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,即该售货小组销售额的标准差为109.62元。,【课练】计算下表中某公司职工月工资的标准差。,解:,即该公司职工月工资的标准差为167.9元。,标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; 用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.,标准差的简捷计算,总方差、组间方差和组内方差。,组内方差反映组内标志值对组平均数的方差,组间方差反映组平均数对总平均数的方差。,它们之间的关系为,变量的方差等于变量平方的平均数减去变量平均数的平方。,方差与标准差的数学性质,变量对算术平均数的方差小于对任何常数的方差。,n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。,变量线性变换的方差等于变量的方差乘以变量系数的平方。,n个同性质独立变量和的方差等于各个变量方差的和,是非标志的方差与标准差,如前是非标志的平均数为P,由于标准差有良好的数学性质,相比较而言,它的应用最为广泛。,例:某工厂生产某种产品合格率为95,不合格率为5,求是非标志的方差及标准差。,上面介绍的极差、方差和标准差等都是反映数据分散程度的绝对指标,而且一般都是带有计量单位的有名数。这些标志变异指标的大小不仅受总体各单位标志值离散程度的影响,而且还受到标志值自身水平高低的影响。因此在比较不同总体的标志变异程度及其平均指标代表性大小时,不能直接用上述各种标志变异指标来比较,而必须采用反映标志变异程度的相对指标,即标志变异系数(也称标志变动系数或离散系数)来比较。,标志变异系数,计算公式为,例如,将极差与其平均数对比,得到极差系数;将标准差与其平均数对比,得到标准差系数。最常用的标志变异系数是标准差系数。,各种变异指标与其算术平均数之比。一般用V表示。,身高的差异水平:cm,用变异系数可以进行比较,体重的差异水平:kg,不可比,某地区工薪阶层人员的月平均收入为1000 元,标准差为200元;个体工商业者的月平均收入为3000元,标准差为300元。试比较工薪阶层和个体工商业者那个的月平均收入的代表性更高?,例,计算两者的标准差系数分别为,工薪阶层人员 200/1000=20% 个体工商业者 300/3000=10%,计算结果表明,个体工商业者的月平均收入的标准差系数比工薪阶层人员的小,说明个体工商业者收入水平的差异程度比工薪层人员的小,其月平均收入水平的代表性要比工薪阶层的高。,【课练】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,解:,一班成绩的标准差系数为:,二班成绩的标准差系数为:,

    注意事项

    本文(贵州财经学院数学与统计学院.PPT)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开