欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载  

    SPSS聚类分析具体操作步骤-spss如何聚类.ppt

    • 资源ID:10062102       资源大小:328KB        全文页数:20页
    • 资源格式: PPT        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS聚类分析具体操作步骤-spss如何聚类.ppt

    SPSS的聚类分析,俗语说,物以类聚、人以群分。 但什么是分类的根据呢? 举例:要想把中国的县分成若干类,就有很多种分类法; 可以按照自然条件来分, 比如考虑降水、土地、日照、湿度等各方面; 也可以考虑收入、教育水准、医疗条件、基础设施等指标; 既可以用某一项来分类,也可以同时考虑多项指标来分类。,2,聚类分析概述,(一)概念 (1)聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. 例如:细分市场、消费行为划分 聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大.,3,(二)“亲疏”程度的衡量 (1)衡量指标 相似性:数据间相似程度的度量 距离: 数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不同的类 (2)衡量对象 个体间距离 个体和小类间、小类和小类间的距离,4,两个距离概念,按照远近程度来聚类需要明确两个概念:一个是点和点之间的距离,一个是类和类之间的距离。 点间距离有很多定义方式。最简单的是欧式距离,还有其他的距离。 当然还有一些和距离相反但起同样作用的概念,比如相似性等,两点越相似度越大,就相当于距离越短。 由一个点组成的类是最基本的类;如果每一类都由一个点组成,那么点间的距离就是类间距离。但是如果某一类包含不止一个点,那么就要确定类间距离, 类间距离是基于点间距离定义的:比如两类之间最近点之间的距离可以作为这两类之间的距离,也可以用两类中最远点之间的距离作为这两类之间的距离;当然也可以用各类的中心之间的距离来作为类间距离。在计算时,各种点间距离和类间距离的选择是通过统计软件的选项实现的。不同的选择的结果会不同,但一般不会差太多。,5,SPSS中聚类分析分类,(一)按分类对象 对变量的聚类称为R型聚类 对观测值聚类称为Q型聚类 这两种聚类在数学上是对称的,没有什么不同。 (二)按聚类的方法分类 分层聚类或系统聚类分析 快速聚类分析 两步聚类分析:新型的,6,事先不用确定分多少类:分层聚类,分层聚类或系统聚类(hierarchical cluster)。开始时,有多少点就是多少类。 它第一步先把最近的两类(点)合并成一类,然后再把剩下的最近的两类合并成一类; 这样下去,每次都少一类,直到最后只有一大类为止。显然,越是后来合并的类,距离就越远。再对饮料例子来实施分层聚类。,7,对于一个数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。 比如学生成绩数据就可以对学生按照理科或文科成绩(或者综合考虑各科成绩)分类, 当然,并不一定事先假定有多少类,完全可以按照数据本身的规律来分类。,8,快速聚类,k-均值聚类(k-means cluster,也叫快速聚类,quick cluster)却要求你先说好要分多少类。看起来有些主观 假定你说分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(SPSS软件自动为你选种子);也就是说,把这3个点作为三类中每一类的基石。 然后,根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来的“种子”就没用了),重新按照距离分类。 如此叠代下去,直到达到停止叠代的要求. 适合处理大样本数据。,9,特点 聚类分析前所有个体所属的类别是未知的,类别个数一般也是未知的,分析的依据只有原始数据,可能事先没有任何有关类别的信息可参考 严格地,聚类分析并不是纯粹的统计技术,不象其他多元分析,需要从样本去推断总体 一般不涉及统计量分布,也不需显著性检验 聚类分析更象是一种建立假设的方法,而对相关假设的检验还需要借助其他统计方法,10,注意 聚类分析主要用于探索性研究,其分析结果可提供多个可能的解,最终解的选择需要研究者的主观判断和后续分析 聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终解都可能产生实质性的影响 不管实际数据中是否存在不同的类别,利用聚类分析都能得到分成若干类别的解,11,下面以对观测值聚类即Q型聚类为例 演示用spss进行聚类分析的具体步骤: 对一个班的数学水平进行聚类,12,Q型聚类,对样本也就是观察个案的聚类,13,单击“方法”按钮弹出对话框,下拉框指定的是小类之间的距离计算方法7种供用户选择,14,度量标准 计算样本距离的方法,15,点击“继续”接下来指定SPSS分析图形输出,属性图以树的形式展现聚类分析的每一次合并过程。冰柱图通过表格中的冰柱显示。 可以指定并主图的输出方向,纵向和横向,16,显示凝聚状态表,单击“统计量”,17,单一方案:输入一个具体数值n,n小于样本总数,表示仅显示聚类成n类时,个各类的成员构成 方案范围:指定显示聚成n1类到n2类时,个各类的成员构成。,18,设定保存层次聚类分析的结果,无,是指不保存到编辑窗口中。,19,结果与讨论,20,

    注意事项

    本文(SPSS聚类分析具体操作步骤-spss如何聚类.ppt)为本站会员(啊飒飒)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开