欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载  

    02-3平均数抽样分布(正式).ppt

    • 资源ID:3455574       资源大小:863.02KB        全文页数:36页
    • 资源格式: PPT        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    02-3平均数抽样分布(正式).ppt

    第二章 概率与理论分布,第三节 平均数抽样分布,研究总体与从中抽取的样本之间的关系是统计学的中心内容 。对这种关系的研究可从两方面着手: (1)抽样分布:从总体到样本 ,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布; (2)统计推断: 从样本到总体,这就是统计推断(statistical inference)问题。,统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对样本的抽样分布有所了解。 我们知道,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同而有所不同,因而样本统计量也是随机变量, 也有其概率分布。我们把统计量的概率分布称为抽样分布。,由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。 复置抽样:指每次抽出一个个体后,这个个体应返回原总体; 不复置抽样:指每次抽出的个体不返回原总体。 对于无限总体,返回与否都可保证各个体被抽到的机会相等。 对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。,一、抽样的目的go 二、样本平均数及其分布go 三、样本平均数差数及其分布go 四、t分布go,导言,一、抽样的目的 运用样本推断总体 试验测定所得 样本数据; 试验目的 获得总体信息 因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息,总体 ,从总体抽取样本,从样本推断总体,导言,总体 ,从总体抽取样本,从样本推断总体,二、样本平均数及其分布:,许多 Si 形成样本标准差抽样分布。,许多 形成样本平均数抽样分布。由样本平均数构成的总体称为样本平均数的抽样总体。,和一个标准差Si 。,每一个样本有一个样本平均数,样本平均数 抽样分布,二、样本平均数及其分布:,抽样分布总体与原总体有什么关系? 与 ? 与 ? 抽样分布总体与原总体关系如下: 1、样本平均数分布的平均数等于原总体平 2、样本平均数分布的标准差等于原总体标 即,(标准误),准差除以,均数,即,标 准 误 标 准 误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低 。 标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明各样本平均数 间的差异程度小 , 样本平均数的精确性高。 的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体抽样 ,因为是一常数 ,所以只有增大样本含量才能降低样本平均数 的抽样误差。,注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于: 样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1 ,x2 ,xn,变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样本平均数 , , 的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。,对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 ±S,用以说明所考察性状或指标的优良性与稳定性。 对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 ± , 用 以表示 所考察性状或指标的优良性与 抽样误差的大小。,3、若原分布为正态分布,平均数分布亦为正态分布。 若原分布是非正态分布,当n增大时,平均数分布亦趋向正态分布。 所以n30时,可以认为新分布符合正态分布。,例3-4,某品种葡萄总体,果穗长=30cm,=10.8cm, 随机抽50个果穗,所得样本平均数与相差不超过3cm的概率是多少? 解:已知U= 查附表3得 P (yU +0.28,以及y U -0.28) =0.78 P (U -0.28y U +0.28) =1-0.78=0.22=22% 以上做法对不对 不对! 分析:已知、,求 | -|3cm的概率,求样本平均数的信息,算U值须用 ,上面的解答错用 。,?,正确做法: 从样本均数分布规律入手 样本均数分布 解: U= 查附表3得P (yU +1.96,以及y U -1.96) =0.05 P (U -1.96y U +1.96) =1-0.05=0.95,若题目改为某葡萄品种总体,果穗长=30cm,=10.8cm,若从其中抽取50个穗,问50 穗中,长度与相差不超过3cm的果穗共有多少穗? 解:U= P=0.22=22% 50×0.22=11(穂),例3-5 某枇杷单果重=30g, =9.6g, 今从中抽取50个 分析:已知总体分布=30,=9.6, 问 解:,的概率是多少?,的概率P?,样本中,果,其平均单果重,查附表3得两尾概率0.46,那么单尾概率=0.46/2=0.23,所以平均单果重小于等于29g的概率为0.23。,若将是题目改成:某枇杷品种平均单果重=30g,=9.6g,问单果重小于29g的概率是多少? 解:U= P(29X30)=0.0398 P(X29)=0.5-0.0398=0.4602,查附表3得两尾概率0.92,那么单尾概率=0.92/2=0.46,所以单果重小于等于29g的概率为0.46。,例:在江苏沛县调查336个平方米小地老虎虫危害情况的结果, =4.37头, =2.63,试问样本容量n=30时,由于随机抽样得到样本平均数 等于或小于4.37的概率为多少? 查附表2,(u-0.75)=0.2266,即概率为22.66%(属于一尾概率)。因所得概率较大,说明差数-0.36是随机误差,从而证明这样本平均数4.37是有代表性的。相对精确度估计为:,附:变异系数 CV= 用处: (1)比较不同性质、不同单位、平均数相差很远的资料之间的变异情况; (2)在空白试验中作为测定土壤差异的指标(解释空白试验); (3)在田间试验设计中,作为确定试验小区面积和重复次数的依据。,平均数有没有变异系数? 反映样本平均数的离散(变异)情况。 每一个 都代表总体平均数, 可是它们之间存在差异。 为什么 因为存在抽样误差。,有。,之间有差异?,是的无偏估计。,是一个样本的平均数,,所以也是抽样误差的反映,即精确度。 因而, 又称为精确度。 越大,精确度越低。 越小,精确度越高。,是,之间差异是抽样误差的反映,,之间差异的估量值,,三、样本平均数差数的分布,总体1 1,总体2 2,三、样本平均数差数的分布:,差数总体概率分布规律 1、差数总体平均数 即差数总体的平均数等于原来两个总体平均数之差。 2、差数总体标准差,3、如果原来两个总体作正态分布,则样本平均数差数 如原两个总体非正态分布(或分布未知): 1)当n1 、n2均大于30,样本平均数差数 2)当n1 、n2 中有一小于或等于30 时,样本平均数差数(,总体遵从正态分布;,总体遵从正态分布,即,)总体遵从t分布。,附: 不同情况下的变形形式 当平均数来自同一个总体,有1=2=,且n1=n2=n时, 则 当平均数来自不同总体,但是n1=n2=n时, 当平均数来自同一个总体,有1=2=,但n1n2时 则,则,平均数抽样分布 平均数总体平均数 平均数总体标准差 平均数总体遵从什么分布 平均数差数的分布 差数总体平均数 差数总体标准差 差数总体遵从什么分布,五、二项总体的抽样分布,(一)二项总体的分布参数 为了说明二项(0、1)总体的抽样分布特征,以总体内包含5个个体为例,每一个体,y=0,y=1。若总体的变量为:0,1,0,1,1,则总体平均数和方差为: =(0+1+0+1+1)/5=3/5=0.6 2=(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2 +(1-0.6)2/5=0.24 = 二项总体的平均数=p,方差为2 =p(1-P)=pq,标准差为=,= 0.49,(二)样本平均数(成数)的抽样分布 从二项总体进行抽样得到样本,样本平均数(成数)的分布为二项式分布,平均数 ,方差 ,标准误 。 (三)样本总和数(次数)的抽样分布 从二项总体进行抽样得到样本,样本总和数(次数)的分布为二项式分布,平均数 ,方差 ,标准误,例、棉田盲椿象为害棉株分为受害株和未受害株。假定调查2000株作为一个总体,受害株为704株。此二项总体中受害率p=35.2%, =0.4776,现从这一总体抽样,以株为单位,用简单随机抽样方法,调查200株棉株,获得74株受害,那么,观察受害率 ,试问样本平均数与总体真值的差数的概率为多少? p=0.352,差数=0.370-0.352=0.018,样本平均数的标准差为: =0.034。由于样本容量大于30,样本平均数的分布可以看作正态分布,故可以计算正态离差u查出概率. 查附表3,当u=0.53,概率值为0.59,两尾概率为0.59,故样本的受害率为37%有代表性。,第七节 t 分 布,五、t分布 由样本平均数抽样分布的性质知道: 若yN(, 2), 则 N(, 2/n)。 将随机变量 标准化得: , 则uN(0,1)。 当总体标准差未知时, 以样本标准差S代替所得到的统计量 记为t。在计算 时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布(tdistribution)。它的概率分布密度函数如下:,(4-26) 式中,t的取值范围是(-,+); df=n-1为自由度。 t分布的平均数和标准差为: t0 (df1), (df2) (4-27) t分布密度曲线如图4-13 所示,其特点是:,图4-13 不同自由度的t分布密度曲线,1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值。 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t 分布与标准正态分布完全一致。,t分布的概率分布函数为: (4-28) 因而t在区间(t1,+)取值的概率右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-,-t1)取值的概率也为1-F t (df)。 于是 t 分布 曲线 下由-到- t 1和由t 1到+ 两 个 相 等 的 概 率 之和两尾概率为2(1-F t (df)。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表4,即t分布表。,例如,当df=15时,查附表4得两尾概率等于0.05的临界t值为 =2.131,其意义是: P(-t-2.131)= P(2.131t+) =0.025; P(-t-2.131)+ (2.131t+) =0.05。 由附表4可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大 。 当 概 率 P 一定时,随着df的增加,临界t值在减小,当df=时,临界t值与标准正态分布的临界u值相等。,The end,

    注意事项

    本文(02-3平均数抽样分布(正式).ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开