[理学]SPSS16实用教程课后答案.doc

资源ID：1986577 资源大小：841KB 全文页数：33页
资源格式： DOC 下载积分：6元

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要6元

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

[理学]SPSS16实用教程课后答案.doc

1-1 答：SPSS的运行方式有三种，分别是批处理方式、完全窗口菜单运行方式、程序运行方式。1-2 答：与一般电子表格处理软件相比，SPSS的“Data View”窗口还有以下一些特性：（1）一个列对应一个变量，即每一列代表一个变量（Variable）或一个被观测量的特征；（2）行是观测，即每一行代表一个个体、一个观测、一个样品，在SPSS中称为事件（Case）；（3）单元包含值，即每个单元包括一个观测中的单个变量值；（4）数据文件是一张长方形的二维表。2-1 答：SPSS中输入数据一般有以下三种方式：（1）通过手工录入数据；（2）可以将其他电子表格软件中的数据整列（行）的复制，然后粘贴到SPSS中；（3）通过读入其他格式文件数据的方式输入数据。2-2 答：选择“Transform”菜单的Replace Missing Values命令，弹出Replace Missing Values对话框。先在变量名列中选择1个或多个存在缺失值的变量，使之添加到“New Variable(s)”框中，这时系统自动产生用于替代缺失值的新变量。最后选择合适的替代方式即可。2-3 答：选择“Data”菜单中的Weight Cases命令，出现如图2-22所示的Weight Cases对话框。其中， Do not weight cases项表示不做加权，这可用于取消加权；Weight cases by项表示选择1个变量做加权。2-4 答：变量的自动赋值可以将字符型、数字型数值转变成连续的整数，并将结果保存在一个新的变量中。具体操作的过程如下：选择“Transform”菜单中的Automatic Recode命令，在出现的对话框中，从左边的变量列表中选择需要自动赋值的变量，将它添加到Variable -> New Name框中，然后在下面New Name右边的文本框中输入新的变量名称，单击New Name按钮，将新的变量名添加到上面的框中。从Recode Starting from框中有两个选项中选择一个，然后单击OK按钮，即可完成自动赋值运算。3-1 答：一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。3-2 答：均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合，比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。中位数是指将数据按大小顺序排列起来，形成一个数列，居于数列中间位置的那个数据。中位数的作用与算术平均数相近，也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中，中位数就等于算术平均数。在数列中出现了极端变量值的情况下，用中位数作为代表值要比用算术平均数更好，因为中位数不受极端变量值的影响。众数是指一组数据中出现次数最多的那个数据。它主要用于定类（品质标志）数据的集中趋势，当然也适用于作为定序（品质标志）数据以及定距和定比（数量标志）数据集中趋势的测度值。3-3FREQUENCIES VARIABLES=销售额 /NTILES=4 /STATISTICS=STDDEV MEAN MEDIAN /ORDER=ANALYSIS.频率附注创建的输出18-十月-2010 15时04分19秒注释输入活动的数据集数据集0过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行30缺失值处理对缺失的定义用户定义的丢失值作为丢失对待。使用的案例统计量的计算将基于所有包含有效数据的案例。语法FREQUENCIES VARIABLES=销售额 /NTILES=4 /STATISTICS=STDDEV MEAN MEDIAN /ORDER=ANALYSIS.资源处理器时间0:00:00.015已用时间0:00:00.016数据集0 统计量销售额N有效30缺失0均值277.40中值277.00标准差28.246百分位数25256.0050277.0075301.00销售额频率百分比有效百分比累积百分比有效21013.33.33.323413.33.36.723913.33.310.024926.76.716.725213.33.320.025626.76.726.725713.33.330.025813.33.333.326513.33.336.726713.33.340.026813.33.343.327313.33.346.727613.33.350.027826.76.756.728613.33.360.029013.33.363.329713.33.366.729826.76.773.330126.76.780.030913.33.383.331013.33.386.731113.33.390.031613.33.393.331813.33.396.732213.33.3100.0合计30100.0100.0答：（1）该百货公司日销售额的均值为277.4万元，中位数为270万元，四分位数为256万元。答：日销售额的标准差为28.246。4-4FREQUENCIES VARIABLES=成年组身高幼儿组身高 /STATISTICS=STDDEV VARIANCE /ORDER=ANALYSIS.频率附注创建的输出18-十月-2010 15时32分24秒注释输入活动的数据集数据集0过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行10缺失值处理对缺失的定义用户定义的丢失值作为丢失对待。使用的案例统计量的计算将基于所有包含有效数据的案例。语法FREQUENCIES VARIABLES=成年组身高幼儿组身高 /STATISTICS=STDDEV VARIANCE /ORDER=ANALYSIS.资源处理器时间0:00:00.000已用时间0:00:00.062数据集0 统计量成年组身高幼儿组身高N有效1010缺失00标准差4.1584.243方差17.28918.000频率表成年组身高频率百分比有效百分比累积百分比有效168110.010.010.0169110.010.020.0171110.010.030.0172220.020.050.0174110.010.060.0175110.010.070.0178110.010.080.0179110.010.090.0180110.010.0100.0合计10100.0100.0幼儿组身高频率百分比有效百分比累积百分比有效68220.020.020.069220.020.040.071110.010.050.072110.010.060.073220.020.080.075110.010.090.082110.010.0100.0合计10100.0100.0 答：应采用方差、标准差来比较成年组和幼儿组的身高差异，答：通过分析，成年组的身高方差为17.289，标准差为4.158；幼儿组的身高方差为18.000，标准差为4.243。幼儿组身高差异大。4-1 答：通过单一样本T检验可以检验某个单一样本某变量的总体均值与指定值之间是否存在显著差异。4-2 答：对两个独立样本进行均值差异检验需要通过两步来完成：第一，利用F检验判断两总体的方差是否相同；第二，根据第一步的结果，决定T统计量和自由度计算公式，进而对T检验的结论作出判断。4-3 答：两配对样本T检验的前提要求如下：两个样本应是配对的；样本来自的两个总体应服从正态分布。4-4FREQUENCIES VARIABLES=用药前用药后 /STATISTICS=STDDEV VARIANCE MEAN /ORDER=ANALYSIS.频率附注创建的输出18-十月-2010 15时44分11秒注释输入活动的数据集数据集1过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行6缺失值处理对缺失的定义用户定义的丢失值作为丢失对待。使用的案例统计量的计算将基于所有包含有效数据的案例。语法FREQUENCIES VARIABLES=用药前用药后 /STATISTICS=STDDEV VARIANCE MEAN /ORDER=ANALYSIS.资源处理器时间0:00:00.000已用时间0:00:00.220数据集1 统计量用药前用药后N有效66缺失00均值124.67118.67标准差13.24618.217方差175.467331.867频率表用药前频率百分比有效百分比累积百分比有效107116.716.716.7115116.716.733.3120116.716.750.0127116.716.766.7138116.716.783.3141116.716.7100.0合计6100.0100.0用药后频率百分比有效百分比累积百分比有效102116.716.716.7107116.716.733.3108116.716.750.0120116.716.766.7123116.716.783.3152116.716.7100.0合计6100.0100.0T检验成对样本统计量均值N标准差均值的标准误对 1用药前124.67613.2465.408用药后118.67618.2177.437成对样本相关系数N相关系数Sig.对 1用药前 & 用药后6.653.159成对样本检验成对差分差分的 95% 置信区间均值标准差均值的标准误下限上限对 1用药前 - 用药后6.00013.8565.657-8.54120.541成对样本检验tdfSig.(双侧)对 1用药前 - 用药后1.0615.337（1）答：用药前的均值为124.67，方差为175.467；用药后的均值为118.67，方差为331.867.（2）答：根据T 检验可得：其相伴概率为0.337，比显著性水平0.05小，拒绝T检验的零假设，治疗前后病人血压有显著变化。4-5T-TEST GROUPS=班级('甲' '乙') /MISSING=ANALYSIS /VARIABLES=成绩 /CRITERIA=CI(.95).T检验附注创建的输出18-十月-2010 16时02分45秒注释输入活动的数据集数据集2过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行40缺失值处理缺失的定义用户定义的缺失值将作为缺失对待。使用的案例每个分析的统计量是根据分析中的每个变量的值都不缺失或超出范围的案例计算的。语法T-TEST GROUPS=班级('甲' '乙') /MISSING=ANALYSIS /VARIABLES=成绩 /CRITERIA=CI(.95).资源处理器时间0:00:00.016已用时间0:00:00.219数据集2 组统计量班级N均值标准差均值的标准误成绩甲2083.606.7001.498乙2075.459.1792.053独立样本检验方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值成绩假设方差相等1.110.2993.20738.0038.150假设方差不相等3.20734.768.0038.150独立样本检验均值方程的 t 检验差分的 95% 置信区间标准误差值下限上限成绩假设方差相等2.5413.00613.294假设方差不相等2.5412.99013.310答：相伴概率0.461大于显著水平0.05，不能拒绝反差相等假设，可以认为两班成绩无显著性差异。5-1 答：方差分析可以用来检验两个及两个以上样本均数之间是否存在显著差异。5-2答：因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响，还要分析多个控制变量交互作用对观察变量的影响，及其他随机变量对结果的影响。因此，它需要将观察变量总的离差平方和分解为3个部分。5-3 答：协方差分析是将那些很难控制的因素作为协变量，在排除协变量影响的条件下，分析控制变量对观察变量的影响，从而更加准确地对控制因素进行评价。当有一些很难控制的随机变量时，可以使用协方差分析将这些随机变量作为协变量。5-4ONEWAY 肺活量测定数 BY 组别 /POLYNOMIAL=1 /STATISTICS HOMOGENEITY WELCH /PLOT MEANS /MISSING ANALYSIS /POSTHOC=SNK LSD ALPHA(0.05).单向附注创建的输出08-十一月-2010 15时08分23秒注释输入活动的数据集数据集0过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行29缺失值处理缺失定义用户定义的缺失值以缺失对待。使用的案例每个分析的统计量都基于对于该分析中的任意变量都没有缺失数据的案例。语法ONEWAY 肺活量测定数 BY 组别 /POLYNOMIAL=1 /STATISTICS HOMOGENEITY WELCH /PLOT MEANS /MISSING ANALYSIS /POSTHOC=SNK LSD ALPHA(0.05).资源处理器时间0:00:01.265已用时间0:00:03.906数据集0 方差齐性检验肺活量测定数Levene 统计量df1df2显著性.408226.669ANOVA肺活量测定数平方和df均方F显著性组间（组合）10.91925.46097.103.000线性项未加权的10.804110.804192.160.000加权的10.804110.804192.160.000偏差.1151.1152.045.165组内1.46226.056总数12.38128均值相等性的键壮性检验肺活量测定数统计量adf1df2显著性Welch83.234217.291.000a. 渐近 F 分布。在此之后检验多重比较因变量:肺活量测定数(I) 组别(J) 组别95% 置信区间均值差 (I-J)标准误显著性下限上限LSD12-.59889*.10895.000-.8228-.37493-1.47000*.10604.000-1.6880-1.252021.59889*.10895.000.3749.82283-.87111*.10895.000-1.0951-.6472311.47000*.10604.0001.25201.68802.87111*.10895.000.64721.0951*. 均值差的显著性水平为 0.05。同类子集肺活量测定数组别alpha = 0.05 的子集N123Student-Newman-Keulsa,b1101.6900292.28893103.1600显著性1.0001.0001.000将显示同类子集中的组均值。a. 将使用调和均值样本大小 = 9.643。b. 组大小不相等。将使用组大小的调和均值。将不保证 I 类错误级别。均值图答：用单因素方差检验进行检验得，患者，可疑患者和非患者三个组的总体方差是相等的，也就具备了进行方差检验的条件，从单因素发差检验结果看，这三个组之间存在着显著差异。5-5UNIANOVA 入院前的血压 BY 组别 WITH 入院治疗后的血压 /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /PRINT=HOMOGENEITY /CRITERIA=ALPHA(.05) /DESIGN=入院治疗后的血压组别.方差的单变量分析附注创建的输出08-十一月-2010 15时22分18秒注释输入活动的数据集数据集1过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行18缺失值处理对缺失的定义用户定义的缺失值作为缺失数据对待。使用的案例统计量的计算将基于带有有效数据的所有案例，而这些有效数据适用于模型中的所有变量。语法UNIANOVA 入院前的血压 BY 组别 WITH 入院治疗后的血压 /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /PRINT=HOMOGENEITY /CRITERIA=ALPHA(.05) /DESIGN=入院治疗后的血压组别.资源处理器时间0:00:00.031已用时间0:00:00.171数据集1 主体间因子N组别061626误差方差等同性的 Levene 检验a因变量:入院前的血压Fdf1df2Sig.3.114215.074检验零假设，即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + 入院治疗后的血压 + 组别主体间效应的检验因变量:入院前的血压源III 型平方和df均方FSig.校正模型802.994a3267.665.599.626截距3638.14313638.1438.137.013入院治疗后的血压277.9941277.994.622.444组别711.5172355.759.796.471误差6259.50614447.108总计532375.00018校正的总计7062.50017a. R 方 = .114（调整 R 方 = -.076）答：这三个组别的接受治疗的患者在接受治疗之前各组之间没有显著性差异，在接受治疗之后，三个组别之间仍然没有显著性差异。但是通过配对样本的T检验得知，用这三种治疗方法进行治疗的患者在治疗前后血压都有有显著性差异，也即是说三种治疗方法都是有效的，并且彼此之间差别不显著。6-1答：相关分析（correlation analysis），相关分析是研究现象之间是否存在某种依存关系，并对具体有依存关系的现象探讨其相关方向以及相关程度，是研究随机变量之间的相关关系的一种统计方法。常用方法有二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析、距离相关分析。6-2偏相关研究在多变量的情况下，当控制其他变量影响后，两个变量间的直线相关程度。又称净相关或部分相关。6-3答：距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。6-4近似值案例处理摘要案例有效缺失合计N百分比N百分比N百分比12100.0%0.0%12100.0%近似矩阵值向量间的相关性 1234567811.000.407.780.610.281.396.317.5422.4071.000.162.622.237.956.387.6413.780.1621.000.488.441.298.372.4274.610.622.4881.000.301.603.268.9365.281.237.441.3011.000.327.950.4966.396.956.298.603.3271.000.440.6077.317.387.372.268.950.4401.000.4338.542.641.427.936.496.607.4331.0009.489.799.406.795.239.801.368.66210.370.674.225.643.708.612.697.85411.694.501.496.392.687.429.770.54412.027.268-.105-.269.589.244.760-.091这是一个相似性矩阵近似矩阵值向量间的相关性 91011121.489.370.694.0272.799.674.501.2683.406.225.496-.1054.795.643.392-.2695.239.708.687.5896.801.612.429.2447.368.697.770.7608.662.854.544-.09191.000.475.378.03010.4751.000.745.37011.378.7451.000.60212.030.370.6021.000这是一个相似性矩阵由上图可jud2和jud6比较相似6-5偏相关数据集1 相关性控制变量v1v2v3v4y-无-av1相关性1.000.719.602.342.533显著性（双侧）.000.001.075.003df026262626v2相关性.7191.000.958.826.693显著性（双侧）.000.000.000.000df260262626v3相关性.602.9581.000.934.664显著性（双侧）.001.000.000.000df262602626v4相关性.342.826.9341.000.560显著性（双侧）.075.000.000.002df262626026y相关性.533.693.664.5601.000显著性（双侧）.003.000.000.002.df262626260yv1相关性1.000.572.391.062显著性（双侧）.002.044.758df0252525v2相关性.5721.000.924.734显著性（双侧）.002.000.000df2502525v3相关性.391.9241.000.907显著性（双侧）.044.000.000df2525025v4相关性.062.734.9071.000显著性（双侧）.758.000.000.df2525250a. 单元格包含零阶 (Pearson) 相关。第一，第二，第三产业在国民生产总值中所占的比例越来越大7-1 答：一元线性回归分析：一元线性回归分析是排除其他因素确定的条件下，分析某一个因素是如何影响另一事物的过程所进行的分析是理想化的。一元线性回归分析只涉及一个自变量的回归问题。多元线性回归分析：研究线性相关条件下两个或两个以上自变量的数量变化关系，成为多元线性回归分析。用于解决两个或两个以上自变量对一个因变量的数量变化关系问题。7-2 答：非线性回归问题大多数可以化为线性回归问题来求解，也就是通过对非线性回归模型进行适当的变量变换，使其化为线性模型来求解。曲线估计是在用户往往不能确定究竟该选择何种函数模型更接近样本数据时采用的方法。7-3答：最小二乘法是加权最小二乘法的特例。使用最小二乘法需要一些前提，数据大多数时候是满足这些条件的。但有时候这些条件是不能满足的，这时需要对原始数据作适当变换，让他符合最小二乘法的使用条件，然后继续使用最小二乘法。从整体上看，在处理数据前作的处理相当于在数据上加权，这个时候就把整个处理过程（包括数据事前的变换以及后来运用最小二乘法）看作加了权的最小二乘法。从这个意义上讲，加权最小二乘法就是最小二乘法。7-4 回归数据集0 输入移去的变量b模型输入的变量移去的变量方法1xa.输入a. 已输入所有请求的变量。b. 因变量: y模型汇总模型RR 方调整 R 方标准估计的误差1.232a.054.001152.51371a. 预测变量: (常量), x。Anovab模型平方和df均方FSig.1回归23723.378123723.3781.020.326a残差418687.7701823260.432总计442411.14819a. 预测变量: (常量), x。b. 因变量: y系数a模型非标准化系数标准系数B标准误差试用版tSig.1(常量)72.253275.859.262.796x.298.295.2321.010.326a. 因变量: yY=72.253+0.298x7-5曲线拟合模型描述模型名称MOD_1因变量1y方程1倒数自变量x常数包含其值在图中标记为观测值的变量未指定个案处理摘要N个案总数6已排除的个案a0已预测的个案0新创建的个案0a. 从分析中排除任何变量中带有缺失值的个案。变量处理摘要变量因变量自变量yx正值数66零的个数00负值数00缺失值数用户自定义缺失00系统缺失00模型汇总和参数估计值因变量:y方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1倒数.72510.53814.031168.698605.604自变量为 x。7-6答:(1)原假设为该回归系数与零没有显著差异，备择假设为回归系数与零有显著差异。判决系数为0.000小于0.001说明自变量跟因变量之间存在线性回归关系。（2）y=8.184+0.855x7-7Model Summary and Parameter EstimatesDependent Variable:yEquationModel SummaryR SquareFdf1df2Sig.Logarithmic.80244.470111.000Cubic.89124.42239.000The independent variable is x.Model Summary and Parameter EstimatesDependent Variable:yEquationParameter EstimatesConstantb1b2b3Logarithmic106.4971.591Cubic104.4501.507-.119.003The independent variable is x.由上表可看出三次函数的拟合度为0.891大于对数函数的拟合度0.802从对比图看出三次函数的拟合度的确比对数函数的拟合度高因此决定在研究问题时选择三次函数。Y=168.698+605.604/xY与1/x的相关系数是8-1聚类分析是统计学中研究“物以类聚”问题的一种有效方法，它属于统计分析范畴，其实质是建立一种能将样本数据按照他们在性质上的亲密程度在没有先验知识的情况下进行自动分类，能从本数据出发，自动进行分析，通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等。8-2 答：树形图以树的形式展现聚类分析的每一次合并过程，SPSS首先将各类之间的距离重新转换到0-25之间，然后在近似的表示在图上。树形图可以粗略的表现聚类的过程。冰柱图通过表格中的“X”,符号显示，其样子很像冬天房屋下的冰柱。8-3答：判别分析先根据已知类别的事物的性质（自变量），建立函数式（自变量的线性组合，即判别函数），然后对未知类别的新事物进行判断已将之归入已知的类别中。原则：1事前组别（类）的分类标准（作为判别分析的因变量）要尽可能准确和可靠，否则会影响判别函数的准确性，从而影响判别分析的效果。2所分析的自变量应是因变量的重要影响因素，应该挑选既有重要特性又有区别能力的变量，达到以最少变量而又高辨别能力的目标。3初始分析的数目不能太少。8-4 QUICK CLUSTER tear_res gloss opacity /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(UPDATE) /SAVE CLUSTER DISTANCE /PRINT ID(品种) INITIAL ANOVA CLUSTER DISTAN.快速聚类附注创建的输出08-十一月-2010 15时56分31秒注释输入活动的数据集数据集2过滤器<none>权重<none>拆分文件<none>工作数据文件中

注意事项

本文（[理学]SPSS16实用教程课后答案.doc）为本站会员（音乐台）主动上传，三一文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。