欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    毕业论文-居民消费结构变化趋势的统计分析.doc

    • 资源ID:3942668       资源大小:1.22MB        全文页数:27页
    • 资源格式: DOC        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    毕业论文-居民消费结构变化趋势的统计分析.doc

    Shanghai Lixin University of Commerce 本科生毕业论文本科生毕业论文 居民消费结构变化趋势的统计分析 The statistical analysis on the consumption pattern of citizens 学生姓名 指导教师 论文类别 年 级 专 业 学 号 声明及论文使用的授权 本人郑重声明所呈交的论文是我个人在导师的指导下进行的研究工作及取得的研 究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰 写的研究成果。 论文作者签名 年 月 日 本人同意上海立信会计学院保留使用学位论文的规定,即:学校有权保留送交论 文的复印件,允许论文被查阅和借阅;学校可以上网公布全部内容,可以采用影印、 缩印或其他复制手段保存论文。 论文作者签名 年 月 日 摘要 本文因改革开放以来国家经济发展迅猛,因此对人民生活必定会造成影响,从而 使得不同时期人民的消费结构会发生变化。故文章将着重分析及研究自 2001 年开始全 国不同层面的 20 个城市居民消费结构的变化趋势。 文章主要运用主成分分析法及聚类分析法,观察全国各个层面 20 个省市的城镇居 民消费结构,并且建立对应的消费函数模型,分析消费结构地区差异及原因。最后提 出消费结构升级过程中的不足,衔接好产需关系,并提出合理的政策性建议。首先用 主成分分析法中的因子分析,利用降维的思想将所选取的城镇居民消费支出的 8 大类 中选取了相关性较高的 2 类;第二运用聚类分析,则是将 20 个选取观测的城市,通过 能够度量它们之间相似程度的统计量,将其划分,把相似程度较大的城市聚合为一类, 以此类推直到把所有的城市都聚合完毕,终将选取的 20 个城市分成了 5 类且重新定义 五个类别中居民可支配的均值分成高收入、中高收入、中等收入、中低收入以及低收 入;第三运用了平板数据模型,载入城镇居民消费支出的 8 大类,将通过聚类分析得 到的 5 类城市的收入分组作为截面数据。建立 8 个消费函数模型。最终得出结论:不 同收入层次的城镇居民消费结构是存在差异的,且差异形式各不相同。 关键词关键词:主成分分析法、聚类分析法、消费函数模型、分群图、相关性、平板数主成分分析法、聚类分析法、消费函数模型、分群图、相关性、平板数 据模型据模型 Abstract ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××. ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ××××××××××××××××××××××××××××××××××××××××××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× ××××××××××××××××××××××××××××××××××× Key words: ××× ××× ××× 目录 一、绪论.1 (一)问题的提出及意义.1 (二)本文主要研究目的及内容.2 二、统计方法的选择、原理及步骤.3 (一)数据的选取.3 (二)研究方法原理及步骤.5 三、实证分析及结果10 (一)消费结构变化趋势因子分析10 (二)消费结构变化趋势聚类分析14 (三)消费函数的面板数据模型16 四、综合分析18 (一)消费结构变化趋势综合分析18 (二)原因分析及存在的问题19 五、结论19 参考文献21 致谢22 上海立信会计学院本科生毕业论文 1 一、一、绪论绪论 (一)问题的提出及意义 1问题的提出 自 1978 年改革开放以来,中国的经济迅猛发展。随着经济的发展,人们的生活水 平也得到了提高。因此,人们对生活必需品的追求也有所改变。例如,在改革开放初 期,人们的生活仍然处于满足温饱阶段,主要支出则为食物,衣物等生活必需品上。 而在如今 21 世纪,人们在满足温饱之后,更加追求精神享受,因此主要支出会以娱乐 为主。 我们也可以从恩格尔系数可以看出。恩格尔系数是指食品支出总额占个人消费支出 总额的比重。在总支出金额不变的条件下,恩格尔系数越大,说明用于食物支出的所占 比例越多;恩格尔系数越小,说明用于食用支出所占的比例越少,二者成正比。 图 1-1 城镇居民家庭恩格尔系数 资料来源:中国统计年鉴 由上图我们可以看出,中国城镇居民的消费结构有显而易见的变化。恩格尔系数 从 1978 年 57.5%到 2010 年 35.7%,下降了 21.8%。 从另一方面来说,众所周知,中国地大物博,有 56 个民族,共 960 万平方千米, 34 个省级行政区。外接海洋,内有山脉,南北跨度大。由于地理原因及经济原因等导 致中国内部存在贫富差距,经济发展不平衡。所以,不同地域的人们,因为各个地区 社会经济发展状况不同,经济制度经济结构、产业结构等不同,消费方式也会有所不 同。各地区的消费结构差异也就慢慢显示出来了。 25.00 30.00 35.00 40.00 45.00 50.00 55.00 60.00 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 城城镇镇居居民民家家庭庭恩恩格格尔尔系系数数(%) 城镇居民家庭恩格尔系数(%) 上海立信会计学院本科生毕业论文 2 2问题的研究意义 “消费结构”历年来,定义得略有模糊。本文所引用的定义为,消费结构为,人 们在生活消费过程中各种社会因素,自然因素的相互关系及数量比例的总和【】。 综上所述,伴随着居民消费结构积极地转型,一系列不容忽视的问题出现了,比 较突出的一个问题是:消费结构的地区差异显著。并不是每个地方的居民消费结构转 型情况都是迅速的、高质量的。而且有些地方消费结构合理,而有些地方消费结构却 不合理。不合理的消费结构会影响经济发展,导致经济发展不平衡;而且反过来经济 差异和社会发展差异也会引起居民消费结构地区差异【3】。研究消费经济理论的同时, 消费结构地区差异研究成为现阶段需要研究的一个重要问题。 对居民消费结构的地区差异进行研究分析,可以掌握和探索居民消费结构的变动 趋势以及引起消费结构差异的影响因素,及时调整各地的产业结构和产品结构,促进 产业结构、经济结构的优化,协调好各地的产需关系,减少消费结构的差异,转变消 费结构的不合理性,减少经济差异,促进社会经济持续快速协调发展;同时,可以借 此剖析和评价一定的产业系统的经济效率以及衡量与检验人们的需求获得满足的状况。 而城镇居民的消费支出又占总的居民消费支出比重较大,研究城镇居民消费结构的地 区差异就有其特别的意义了。 (二)本文主要研究目的及内容 本文主要是运用主成分分析和聚类分析的方法及利用平行数据模型,考察了全国 各个层面 20 个省市的城镇居民消费结构,并且建立对应的消费函数模型,分析消费结 构地区差异及原因。这样,不仅可以研究和探索中国主要城市的城镇居民消费结构, 提出消费结构升级过程中的不足,还可以及时调整和优化中国产业结构和产品结构, 衔接好产需关系,并提出一系列合理的政策性建议。 具体的研究内容如下: (1)指标体系的确定:由中国统计年鉴把城镇居民消费支出分为 8 大类:食品, 衣着用品,居住,家庭设备用品及服务,医疗保健,交通和通讯,娱乐教育和文化服 务,其它商品和服务。我们可以直接以这 8 个大类为消费结构的 8 个指标变量来进行 统计分析。 (2)统计方法的选择与论述:主成分分析可以简化观测系统,将众多的指标变 量综合为少数几个公共因子,然后对这些公共因子进行比较分析。经综合考虑比较, 要研究分析中国 20 个城市的城镇居民消费结构的地区差异,运用因子分析模型和聚类 上海立信会计学院本科生毕业论文 3 分析方法共同分析是比较好的统计方法。本文主要介绍了因子分析模型的基本思想原 理与具体方法步骤,然后介绍聚类分析的基本思想,并阐述系统聚类分析的具体方法 步骤。再进行分类之后,再运用平行数据模型建立统一的,消费、收入线性模型。并 且对于此模型的思想原理进行描述,对所能解决的问题进行例证。 (3)中国 20 个省市城镇居民消费结构地区差异综合分析:运用统计软件 SPSS16.0 对搜集到的数据进行具体研究分析,计算原始变量的相关系数矩阵,提取公 共因子,进行因子旋转,得到因子得分,对 20 个省市的因子得分进行系统 Q 型聚类, 将 20 个省市分为 5 类,文章进一步分析了各地区的消费结构地区差异,并且得出引起 这些差异的主要因素是收入。本文提出了加强宏观调控、缩小收入差距等措施,希望 能在一定程度上减弱这种消费结构地区差异。 (4)在进行对中国 20 个省市城镇居民消费结构的分析时,首先要对总消费函数 和运用所提出的公因子而得出的消费函数进行模型识别,接着在模型识别的基础上进 行参数估计,最后就估计参数进行分析。运用平行数据模型对所分类的省市进行回归, 得出各个回归函数,并进行相应的假设检验和结果分析。 二、二、统计方法的选择、原理及步骤统计方法的选择、原理及步骤 (一)数据的选取 考虑到对中国省市的选取应该具有代表性及合理性。 代表性,即应选取的省市能反映中国的现阶段消费结构,本文从地域及经济水平 这两个角度,反映中国消费结构。 合理性,即所选取的省市应该是中国行政区,是有据可查的。 表 2-1 中国 34 个省级行政区划分 【华北华北】【东北东北】【华东华东】【中南中南】【西南西南】【西北西北】【港澳台港澳台】 北京市辽宁省上海市河南省重庆市陕西省 天津市吉林省江苏省湖北省四川省甘肃省 香港 特别行政区 河北省黑龙江省浙江省湖南省贵州省青海省 山西省 安徽省广东省云南省 澳门 特别行政区 福建省西藏自治区 宁夏回族 自治区台湾省 内蒙古 自治区 江西省 广西壮族 自治区 山东省海南省 新疆维吾尔 自治区 资料来源:中国政府网 上海立信会计学院本科生毕业论文 4 从地域划分我们可以将中国的 34 个省级行政区划分为 7 大块。因为港澳台的数据 难以获得,所以本文将排除该部分。 从经济水平方面考察,本文拟用地区生产总值作为考量一个地区经济发展水平是 否发达的标准。如果一个地区的地区生产总值高,则在本文中可以认为该地区经济水 平发达。反之亦然。 表 2-2 2010 年地区生产总值 地 区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 地区生产总值 (亿元) 14113.589224.4620394.269200.8611672.0018457.278667.5810368.60 地 区 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 地区生产总值 (亿元) 17165.9841425.4827722.3112359.3314737.129451.2639169.9223092.36 地 区 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 地区生产总值 (亿元) 15967.6116037.9646013.069569.852064.507925.5817185.484602.16 地 区 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 地区生产总值 (亿元) 7224.18507.4610123.484120.751350.431689.655437.47 资料来源:中国统计年鉴 为了保证以上条件,本文选取华北、东北、华东、中南、西南、西北这 6 部分每 部分中地区生产总值,最高,最低以及为中位数的省市,作为本文的考察对象。选取 省市见表 2-3。 表 2-3 选取的 20 个省市及其 2010 年地区生产总值 区域区域省省/ /市市地区生产总值(亿元)地区生产总值(亿元)区域区域省省/ /市市地区生产总值(亿元)地区生产总值(亿元) 【西南】西藏自治区507.46【华北】内蒙古自治区11672 【西北】青海省1350.43【华东】福建省14737.12 【中南】海南省2064.5【中南】湖北省15967.61 【西北】甘肃省4120.75【中南】湖南省16037.96 【西南】云南省7224.18【华东】上海市17165.98 【东北】吉林省8667.58【西南】四川省17185.48 【华北】山西省9200.86【东北】辽宁省18457.27 【华东】江西省9451.26【华北】河北省20394.26 【西北】陕西省10123.48【华东】江苏省41425.48 【东北】黑龙江省10368.6【中南】广东省46013.06 上海立信会计学院本科生毕业论文 5 (二)研究方法原理及步骤 1 统计方法的选择 本文要对 20 个样品的 8 个指标进行分析,得出这些样品的差异所在及其原因。由 于所选取的指标变量之间有较强的相关性,并且为了使分析客观、全面,我们采用因 子分析方法,利用降维的思想,由指标变量相关矩阵的依赖关系出发,将具有错综复 杂关系的 8 个指标变量归结为少数几个公共因子,使得公共因子内的变量之间相关性 较高,而不同公共因子内的相关性较低,同时要求公共因子变量所包含的指标信息量 占原始指标信息量的 85以上(即公共因子的累积贡献率达到 85以上)。同时为了找 到意义更为明确、实际意义更明显的公共因子,进行因子旋转。抓住这些因子可以帮 助我们对复杂的问题进行分析和解释。当因子模型建立好之后,计算得到各样品的因 子得分。为了便于进行样品间的差异分析及原因分析,以因子得分为变量进行系统聚 类分析为好,把相似的样品归为一类,然后再进行差异分析。这样分析的结果也比较 合理、客观,彼此的差异也更明显,更好分析。 2. 因子分析 2.1 因子分析基本思想 因子分析的基本思想【10】是根据相关阵或协差阵的内部依赖关系把原始变量分组, 使得同组内的变量相关性较高,而不同组的变量间的相关性则较低。每组变量代表一 个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对 于所具体研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是 少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。 2.2 具体方法步骤 针对本文要研究的内容,且在知道样本决策矩阵的情况下,因子分析 ij n m x 的具体步骤如下: 1)为了便于研究,并消除由于观测量纲的差异及数量级不同所造成的影响,将样 本观测数据进行标准化处理,使标准化后的变量均值为 0,方差为 1。并求得其相关 ij x 阵,分析变量之间的相关性。 样本观测数据标准化: 上海立信会计学院本科生毕业论文 6 , j j ij ij xx y 1,2, ;1,2,in jm 其中, , n ijj x n x 1 1 2 1 1 2 1 n i jijj xx n 从而得到标准化样本决策矩阵 mn ij yY 然后计算所有样本的指标相关矩阵: , mm jk rR ik n i ijjk yy n r 1 1 ,1,2,i jm 2)求解初始公共因子及因子载荷矩阵(用主成分法求解)。 有p个变量,则可以找到p个主成分,将所得到的p个主成分按由大到小的顺序排列, 记为。 12 , m Y YY 求相关矩阵的特征值 ,为对应的标准正交化特征向R 12 ,., m 12 , m 量。 选取满足的前p个公共因子,则初始的公共因子为,%85 1 1 m j j p i i pm ,/,1,2, iii FYip 因子载荷矩阵可以表示为:A 。 1122 A(,) pp 3)因子旋转(方差最大化正交旋转)。 设因子载荷矩阵为:, 1112 2222 12mm aa aa aa A 令 上海立信会计学院本科生毕业论文 7 , cossin sincos 则为正交阵。 11121112 21222122 1212 cossinsincos cossinsincos cossinsincos mmmm aaaa aaaa aaaa A 需满足: , 22 2/ 4 ()/ DAB m tg CABm 其中, 22 1111 ,(),2 mmmm jjjjjj jjjj AuBv CuvDu v 121222 2 ()() ,2, jjjj jj jjj aaa a uv hhh (1) 222 12 ,1,2, jjj haajm 如果p2时,则可以每次取2个,全部配对旋转,旋转时总是对初始载荷矩阵A中的 列和列同时进行,此时式(1)中只需将就可以了。变换共需进行 12 , jjjj aaaa 次,这样就完成了第一轮旋转,然后将第一轮旋转所得结果用上述方法1/ 2(1)m m 继续进行旋转,得到第二轮旋转的结果。如此继续下去,当矩阵各列平方的相对方差 之和改变不大时,就可以停止旋转。这样就得到了新的一组公共因子及相应的因子载 荷矩阵。 4)因子得分。 建立如下以公因子为因变量、原始变量为自变量的回归方程: 1122 ,1,2, jjjjmm FXXXjp 在最小二乘意义下,可以得到F 的估计值: 1 FR X A 上海立信会计学院本科生毕业论文 8 式中为因子载荷矩阵,为原是变量的相关阵,为原始变量向量。这样,我ARX 们在得到一组样本值后,可以代入上面的关系式求出公共因子的估计因子得分。 3. 聚类分析 3.1 聚类分析基本思想 聚类分析的基本思想【11】是根据一批样品的多个观测指标,具体找出一些能够度 量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相 似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品 (或指标)又聚合为另外一类关系密切的聚合到一个小的分类单位,关系疏远的 聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,把不同的类型 一一划分出来,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群 图(又称系谱图) ,用它把所有的样品(或指标)间的亲疏关系表示出来。 聚类分析给人们提供了丰富多彩的分类方法,这些方法大致可归纳为:(1)系统聚 类法;(2)模糊聚类法;(3)K均值法;(4)有序样品的聚类;(5)分解法;(6)加入 法。在这里,我们不确定把样品分为几类,运用系统聚类法对样品的因子得分进行聚 类分析。 3.2 具体方法步骤 对因子得分进行系统聚类法的具体步骤如下: 1)计算个样品的距离,共有个。得样品间的距离矩阵,初始个样n ij d 2 n C 0Dn 品各自构成一类,类的个数为,此时类间的距离就是样品间的距离。记初始各类为n 。 12 , n G GG 类与类之间的距离计算方法有 5 种,分别为:(1)最短距离法;(2)最长距离法;(3) 重心法;(4)类平均法;(5)离差平方和法。相比其它方法,类平均法不太浓缩也不太扩 张空间,是比较适中、聚类效果较好的方法。因此,在这里,我们运用类平均法。类 平均法有两种形式,一种是组间联结法(between-groups linkage),另一种是组内联结 法(within-groups linkage)。组间联结法在计算距离时只考虑两类之间距离的平均, 组内联结法在计算距离时把两组所有个案之间的距离都考虑在内。 类平均法定义类与类之间的距离为: 22 1 , pq Gij i Gj G pq Dp qd n n 上海立信会计学院本科生毕业论文 9 用类似的方法可导出这种定义下的距离地推公式如下: 222 , pq GGG rr nn Dk rDk pDk q nn 即样品间的距离。 2 G D ij d 2)选择表中最小的非零数,不妨假设,于是将和合并为一类,记 0D pq d p G q G 为 , rpq GGG 3)利用地推公式计算新类与其它类之间的距离。分别删除表的第行和 0D, p q 第列,并新增一行和一列添上的结果,产生表。, p q 1D 4)在表再选择最小的非零数,其对应的两类又构成新类,再利用地推公式计 1D 算新类与其它类之间的距离。分别删除表的相应的行和列,并新增一行和一 1D 列添上的新类和旧类之间的距离。结果,产生表。类推直至所有的样本点归 2D 为一类为止。 4. 平板数据模型基本原理和思想 为了更加明确平板数据模型的概念,首先必须明确什么是平板数据模型。 为了明确什么是平板数据模型,首先必须明确什么是时间序列数据和横截面数据。 时间序列数据集【】,是由一个或几个经济变量在不同时间的观察值所构成,包括 时点数据和时期数据。例如,在本篇论文中,以上海市为例,居民消费支出中,食品 支出,衣着用品支出,居住支出,家庭设备用品及服务支出,医疗保健支出,交通和 通讯支出,娱乐教育和文化服务支出,其它商品和服务支出,从 2001 年到 2010 年, 这 10 年的数据可构成一组时间序列数据集。 横截面数据集【】,是在给定时点或时期对个人,家庭,企业,地区,国家或一系 列单位采集的样本所构成的数据集。例如,在本篇论文中,以 2011 年数据为例,调查 西藏自治区,青海省,海南省,甘肃省,云南省,吉林省,山西省,江西省,陕西省,黑龙江省,内 蒙古自治区,福建省,湖北省,湖南省,上海市,四川省,辽宁省,河北省,江苏省,广东省这 20 个省市的居民消费支出。这 20 个省市的数据可构成一组横截面数据。 平板数据集【】,是由横截面数据集中每个时间序列组成。例如,在本例中,从 2001 年到 2011 年的 20 个省市的数据则是一组平板数据集。 上海立信会计学院本科生毕业论文 10 设有被解释变量与 1×K 维解释变量构成下列等式, i Y it x 1,2.Tt1,2.N,i uxY ititititit 其中为随即误差项,N 为截面个体总数,T 为时期总数。 面板模型可以分为 3 类,基本模型、变截距模型及变参数模型。 、 基本模型:对于所有截面,与是相同的,即 i ki kjkiji , 变截距模型:对于所有截面,不同但相同,即 i ki kjkiji , 变参数模型:对于所有截面,与都不相同,即 i ki kjkiji , 对于面板数据模型的检验,基于两个原假设: H0: 一般线性模型中的解释变量系数对所有截面个体是相同的,但是截距项不同( 变截距模型)。 H1: 一般线性模型中的解释变量系数和截距项对所有截面个体是相同的( 基本模 型)。 模型形式检验需要利用协方差构造两个 F 统计量: )1(,) 1( )1( ) 1()( 1 12 1 KTNKNF KTNS KNSS F )1(),1() 1( )1( )1() 1()( 1 13 2 KTNKNF KTNS KNSS F 其中,、分别是变系数模型、变截距模型、基本模型的回归残差平方和。 1 S 2 S 3 S 先检验 H1。如果小于某个相应的分布临界值,接受 H1,无需检验 H0,适用基本 2 FF 模型。否则,拒绝 H1,并继续检验 H0。如果小于某个相应的分布临界值,接受 1 FF H0,适用变截距模型。否则,拒绝 H0,适用变系数模型。 三、三、实证分析及结果实证分析及结果 (一)消费结构变化趋势因子分析 表3-1 KMO检验和Bartlett球形检验结果表 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy795 Bartlett's Test of SphericityApprox. Chi-Square179.517 上海立信会计学院本科生毕业论文 11 df28 Sig000 KMO 检验用于检验变量间的偏相关系数是否过小,一般 KMO 统计量大于 0.9 时效果 最佳,0.7 以上可以接受,0.5 以下不宜做因子分析,从表三中可以看出 KMO 检验结果 为 0795,适宜做因子分析。 Bartlett 球形检验用于检验相关系数矩阵是否为单位阵,如果结论是接受原假设, 则表示各个变量都是各自独立的,表三中 Bartlett 球形检验的 Sig.=0.000 0.01,由 此拒绝原假设,即认为各变量之间存在显著的相关性。 表3-2 总方差解释表 Initial EigenvaluesExtraction Sums of Squared Loadings Rotation Sums of Squared Loadings Component Total% of Variance Cumulative % Total% of Variance Cumulative % Total% of Variance Cumulative % 15.55769.46169.4615.55769.46169.4614.87160.88160.881 21.56319.53588.9971.56319.53588.9972.24928.11588.997 3.4095.11694.113 4.2002.50496.617 5.1121.39798.014 6.079.98699.000 7.051.63399.633 8.029.367100.000 表 3-2 是总方差解释列表,给出了每个公因子所解释的方差及其累计和。从表中 可见,第一公因子特征值为 5.557,方差贡献率为 69.461%,根据提取因子的条件 特征值大于 1,本次调查选出了 2 个公因子,方差累计贡献率为 88.997%,故而提取这 1 个公因子比较好地解释原有变量所包含的信息了。 表 3-3 是因子载荷矩阵,是用标准化的公因子近似表示标准化原始变量的系数矩 阵。由此表可以写出特殊因子忽略不计时的因子模型。以居住为例,用 fac1,fac2 表 示各公因子,有 2fac)013 . 0 (1cfa924 . 0 标准化的住房 此时所得为旋转的公因子实际意义不好解释,对公因子进行方差最大化旋转。 上海立信会计学院本科生毕业论文 12 表3-3 因子载荷矩阵 Component 12 食品.821-.496 衣着.538.748 居住.924-.013 家庭设备用品及服务.950-.100 医疗保健.494.785 交通和通信.898-.342 教育文化娱乐服务.961-.062 其它商品和服务.929.099 表3-4 旋转后的因子载荷矩阵 Component 12 食品.953-.111 衣着.179.904 居住.846.371 家庭设备用品及服务.906.303 医疗保健.124.919 交通和通信.959.061 教育文化娱乐服务.900.342 其它商品和服务.805.475 表3-5 旋转因子得分系数矩阵 Component 12 食品.266-.228 衣着-.110.476 居住.155.061 家庭设备用品及服务.182.013 医疗保健-.127.494 交通和通信.238-.132 教育文化娱乐服务.174.036 上海立信会计学院本科生毕业论文 13 其它商品和服务.126.127 因子得分系数矩阵表为标准化公因子用标准化后的原始变量线性表示的系数矩阵。 以公因子一为例,有 126 . 0 174 . 0 238 . 0 )127 . 0 (182 . 0 155 . 0 110 . 0 -266 . 0 1 标准化其他商品和服务 务标准化教育文化娱乐服标准化交通和通信 标准化医疗保健服务标准化家庭设备用品及 标准化居住)(标准化衣着标准化食品标准化fac 表 3-5 因子载荷矩阵。由结果可以看到,旋转后公共因子解释原始数据的能力没 有提高,但旋转后的因子载荷矩阵发生了很大的变化,因子载荷矩阵中的元素更倾向 于 0 或者正负 1,意义更显著。 表3-6 各省市因子得分表 地区地区Factor1Factor2 河 北 -0.630.33 山 西 -0.69-0.03 内蒙古 -0.242.31 辽 宁 -0.131.06 吉 林 -0.671.44 黑龙江 -0.880.88 上 海 3.180.86 江 苏 0.510.07 福 建 0.93-0.78 江 西 -0.18-0.95 湖 北 -0.28-0.09 湖 南 -0.11-0.15 广 东 1.90-0.32 海 南 0.06-1.88 四 川 0.08-0.53 云 南 -0.34-0.98 西 藏 -0.54-1.42 陕 西 -0.420.51 甘 肃 -0.820.05 青 海 -0.76-0.38 上海立信会计学院本科生毕业论文 14 旋转因子载荷矩阵,第一个公共因子对食品,居住,家庭设备用品及服务,交通 和通讯,教育文化娱乐服务及其他商品和服务指标的载荷系数较大,基本上反映了城 镇居民对家庭基本生活资料,精神生活的消费支出信息,因此,第一个公共因子在一 定程度上可以被认为是基本生活资料与精神生活因子。第二个公共因子对衣着与医疗 保健的载荷系数较大,基本上反映了城镇居民花费在衣着与医疗保健上的支出信息, 因此,我们可以把第二个公共因子看作是次基本生活资料支出因子。 这样,经过旋转之后,各公共因子的意义变得更加明确,我们就能更好的对数据 进行分析解释。 最后,我们可以得到各市因子得分表,其中因子得分可以用来描述原始变量的取 值。如下表所示。 (二)消费结构变化趋势聚类分析 对因子得分进行系统聚类分析,因为是对样本聚类,所以选择 Q 型聚类分析。我 们将原始变量标准化,聚类方法选择组内联结法,计算欧氏距离。结果如下。 表3-7 样本有效性检验表 Cases ValidMissingTotal NPercentNPercentNPercent 20100.00.020100.0 该表显示此次聚类分析样本总个数为 20 个,在分析过程中未发现无效样本。 0 2 4 6 8 10 12 14 16 05101520 聚聚合合系系数数 分分类类数数 上海立信会计学院本科生毕业论文 15 由图可看出分类数为 5 或 6 时,曲线变得比较平缓,所以应该分成 5 或 6 类,这 样的分类数符合我们分类的目的。 图 3-1 聚合系数随分类数变化曲线 表3-8 聚类过程的结果 Cluster CombinedStage Cluster First AppearsStage Cluster 1Cluster 2 Coefficients Cluster 1Cluster 2 Next Stage 1219.024005 21016.026007 31112.031006 4118.078008 5220.1581011 61115.2503010 71017.2902012 816.3544011 945.4340015 10811.5390613 1112.6188513 121014.8197016 13181.046111016 149131.1530017 15341.2430918 161102.441131217 17194.167161418 18135.187171519 191713.4541800 该表是反映每一阶段聚类的结果,Coefficients 表示聚合系数,第二列和第三列 表示聚合的类。某阶段的分类数等于总的样品数减去这个阶段的序号。 Case5 ClustersCase5 Clusters 1: 河 北111: 湖 北1 2: 山 西112: 湖 南1 3: 内蒙古213: 广 东4 4: 辽 宁214: 海 南5 5: 吉 林215: 四 川1 6: 黑龙江116: 云 南5 7: 上 海317: 西 藏5 8: 江 苏118: 陕 西1 9: 福 建419: 甘 肃1 10: 江 西520: 青 海1 上海立信会计学院本科生毕业论文 16 表 3-9 聚类表 该表是由 SPSS 直接给出的分类表。我们把它稍微转化一下,就可以得到更清晰明 确的聚类分析的最终结果。如下表, 表 3-10 最终分类结果 第一类第一类第二类第二类第三类第三类第四类第四类第五类第五类 河北内蒙古上海福建江西 山西辽宁 广东海南 黑龙江吉林 云南 江苏 西藏 湖北 湖南 四川 我们将以上五个分类,重新定义,从 2001 年至 2010 年,五个类别中居民可支配 的均值分成高收入、中高收入、中等收入、中低收入以及低收入。 表 3-11 分类定义 中等收入中等收入中低收入中低收入高收入高收入中高收入中高收入低收入低收入 第一类第二类第三类第四类第五类 (三)消费函数的面板数据模型 为了分析收入差异对城镇居民消费结构的影响,本文建立平板数据模型。选取 2001 年至 2010 年的中国统计年鉴的居民消费支出中,食品支出,衣着用品支出, 居住支出,家庭设备用品及服务支出,医疗保健支出,交通和通讯支出,娱乐教育和 文化服务支出,其它商品和服务支出, 。这 10 年的数据可构成一组时间序列数据集, 以上文所分的 5 个收入分组作为截面数据。建立 8 个消费函数模型。 首先应判断这 8 个面板消费函数模型的类型,利用 EViews 6.0 软件计算出面板数 据的三个模型:基本模型、变截距模型和变系数模型。并且记录他们分别所对应的残 差平方和(、) 。在的显著性水平下,且,查 F 分 3 S 2 S 1 S0.051K, 5N, 01T 布表得 ,61 . 2 10, 4FF 0.11 38 . 2 10, 8FF 0.12 上海立信会计学院本科生毕业论文 17 可得下表。 表 3

    注意事项

    本文(毕业论文-居民消费结构变化趋势的统计分析.doc)为本站会员(韩长文)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开