- 194.74 KB
- 2021-06-23 发布
2018年高考数学讲练测【新课标版理】【讲】第十一章 统计,统计案例
第04节 统计案例
【考纲解读】
考 点
考纲内容
五年统计
分析预测
统计案例
(1) 会作两个有关联变量
的数据的散点图,会利用散点图认识变量间的相关关系.
(2) 了解最小二乘法的思
想,能根据给出的线性回归方程系数公式建立线性回归方程.
2017课标Ⅱ,理18
2016课标Ⅲ,理18
2015课标I,理19
2014课标Ⅱ,理19
1.主要考查独立性检验与其他知识的综合,联系实际.
【知识清单】
一.独立性检验
1.分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.列联表
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量,其中n=a+b+c+d为样本容量.
3.独立性检验
利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.
4.独立性检验的步骤
①计算随机变量的观测值k,查表确定临界值k0:
P(≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
②如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(≥k0);否则,就认为在犯错误的概率不超过P(≥k0)的前提下不能推断“X与Y有关系”.
对点练习:
通过随机询问110名性别不同的大学生是否爱好某项运动,得到列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由,计算得
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
【答案】
【考点深度剖析】
1.了解独立性检验(只要求2×2列联表)的基本思想、方法以及其简单应用.
2.了解回归分析的基本思想、方法及其简单应用.
【重点难点突破】
考点1独立性检验
【1-1】【2016北京理16】三个班共有名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时);
班
6 6.5 7 7.5 8
班
6 7 8 9 10 11 12
班
3 4.5 6 7.5 9 10.5 12 13.5
(1)试估计班的学生人数;
(2) 从班和班抽出的学生中,各随机选取一人,班选出的人记为甲,班选出的人记为乙,假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从三个班中各随机抽取一名学生,他们该周的锻炼时间分别是,,(单位:小时),这个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为 ,试判断和的大小,(结论不要求证明).
【答案】(1)40(2)(Ⅲ)
【解析】
(1)由题中的表可知,在班,班,班中被调查的人数分别是5,7,8,再由分层抽样的方法可知,班的学生人数估计值是.
(3).因为表格中三组数据的平均数分别为,,,所以总的的平均值,. 新加的三个数据,,,平均值为,比小,所以拉低了平均值,即.
【1-2】【2017届广西南宁二中等高三8月联考数学】某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为( )
A.90% B.95% C.99% D.99.9%
附:参考公式和临界值表
0.050
0.010
0.001
3.841
6.635
10.828
【答案】C
【领悟技法】
1. 独立性检验的步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式,计算的观测值;
(3)比较与临界值的大小关系作统计推断.
2. 独立性检验得出的结论带有概率性质,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值,3.841和6.635就是两个常用的临界值,一般认为当≥3.841时,则有95%的把握说事件A与B有关;当≥6.635时,则有99%的把握说事件A与B有关.
【触类旁通】
【变式一】【黑龙江省海林市朝鲜中学2018届高三高考综合卷】某学校为判断高三学生选修文科是否与性别有关,现随机抽取50名学生,得到如表列联表:
理科
文科
合计
男
13
10
23
女
7
20
27
合计
20
30
50
根据表中数据得到,已知,
.现作出结论“选修文科与性别相关”,估计这种判断出错的可能性约为( )
A. B. C. D.
【答案】D
【解析】 ,而,这种判断出错的可能性约为 ,选D.
【变式二】【黑龙江省齐齐哈尔市2017届高三上学期第一次模拟考试数学(理)】2016年6月22 日,“国际教育信息化大会”在山东青岛开幕.为了解哪些人更关注“国际教育信息化大会”,某机构随机抽取了年龄在15-75岁之间的100人进行调查,经统计“青少年”与“中老年”的人数之比为9: 11.
(1)根据已知条件完成下面的列联表,并判断能否有的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”;
(2)现从抽取的青少年中采用分层抽样的办法选取9人进行问卷调查.在这9人中再选取3人进行面对面询问,记选取的3人中关注“国际教育信息化大会”的人数为,求的分布列及数学期望.
附:参考公式,其中.
临界值表:
【答案】(1)列联表见解析,有的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”.
(2)分布列见解析,
【解析】试题分析:(Ⅰ)根据统计数据,可得2×2列联表,根据列联表中的数据,计算K2的值,即可得到结论;
(Ⅱ)ξ的可能取值有0,1,2,3,求出相应的概率,可得ξ的分布列及数学期望.
试题解析:
解:(1)依题意可知,抽取的“青少年”共有人,“中老年”共有人.
完成的列联表如下:
则 ,
因为,所以有的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”.
三、易错试题常警惕
易错典例:为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下列表:
喜爱打篮球
不喜爱打篮球
合计
男生
5
女生
10
合计
50
已知在全班50人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上表补充完整(不用写计算过程);
(2)能否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由.下面的临界值表供参考:
(参考公式:,其中)
易错分析:解答此类问题,主要有两类错误,一是不能正确理解临界值表;二是因计算繁琐,出现错误.
温馨提醒:(1)独立性检验是近几年考查渐多的知识点之一,学习中应重视,不能因高考题难度不大而“轻敌”.(2)摆脱对计算器的依赖,多做一些计算训练,提高计算能力.