2020届高考数学一轮课件:11.3 变量的相关性、统计案例 .pptx
11.3 变量的相关性、统计案例,20102019年高考全国卷考情一览表,考点114,考点115,考点114变量的相关性、回归分析 1.(2017·山东,理5,5分,难度)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归,的脚长为24,据此估计其身高为( C ) A.160 B.163 C.166 D.170,考点114,考点115,2.(2015·湖北,文4,5分,难度)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( A ) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关 解析由y=-0.1x+1知y与x负相关,又因为y与z正相关,故z与x负相关.,考点114,考点115,3.(2016·全国3,理18文18,12分,难度)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.,注:年份代码17分别对应年份20082014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,考点114,考点115,考点114,考点115,解(1)由折线图中数据和附注中参考数据得,因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.,考点114,考点115,所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.,考点114,考点115,4.(2015·全国1,理19文19,12分,难度)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,考点114,考点115,(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: 年宣传费x=49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率,考点114,考点115,考点114,考点115,(3)由(2)知,当x=49时,年销售量y的预报值,根据(2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,考点114,考点115,5.(2015·重庆,文17,13分,难度)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:,(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.,考点114,考点115,解(1)列表计算如下:,考点114,考点115,(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为,考点114,考点115,6.(2014·全国2,理19,12分,难度)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:,(1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.,考点114,考点115,解(1)由所给数据计算得,考点114,考点115,纯收入逐年增加,平均每年增加0.5千元. 将2015年的年份代号t=9代入(1)中的回归方程,得,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.,考点114,考点115,考点115独立性检验 1.(2018·全国3,理18文18,12分,难度)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.,考点114,考点115,(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?,考点114,考点115,解(1)第二种生产方式的效率更高. 理由如下: 由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高. 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致,考点114,考点115,呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.,列联表如下:,考点114,考点115,2.(2017·全国2,理18,12分,难度)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,旧养殖法 新养殖法,(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;,考点114,考点115,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).,考点114,考点115,解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62. 新养殖法的箱产量不低于50 kg的频率为 (0.068+0.046+0.010+0.008)×5=0.66. 故P(C)的估计值为0.66. 因此,事件A的概率估计值为0.62×0.66=0.409 2.,考点114,考点115,(2)根据箱产量的频率分布直方图得列联表,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为 (0.004+0.020+0.044)×5=0.340.5, 故新养殖法箱产量的中位数的估计值为,考点114,考点115,3.(2017·全国2,文19,12分,难度)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,旧养殖法 新养殖法,(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;,考点114,考点115,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.,考点114,考点115,解(1)旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.,考点114,考点115,4.(2010·全国,理19文19,12分,难度)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,考点114,考点115,附:,考点114,考点115,解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为,由于9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.,