- 1.43 MB
- 2021-05-19 发布
11.4 统计
挖命题
【考情探究】
考点
内容解读
5年考情
预测热度
考题示例
考向
关联考点
1.随机抽样
1.理解随机抽样的必要性和重要性
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样方法
2015北京文,4
分层抽样
★☆☆
2.统计图表
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点
2017北京文,17
统计图表的理解与应用
古典概型,分层抽样方法
★★☆
2016北京文,17
2014北京文,17
样本估计总体
3.用样本估计总体
1.理解样本数据标准差的意义和作用,会计算数据标准差
2.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释
3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想
4.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
2018北京文,17
抽样方法与总体分布的统计
古典概型的概率
★★☆
2013北京文,16
古典概型的概率和方差
2012北京文,17
古典概型的概率和应用意识
2011北京,17
茎叶图、平均数、方差、分布列和期望
分析解读 1.掌握简单随机抽样、分层抽样等常用抽样方法,体会两种抽样方法的区别与联系及具体的操作步骤.2.会用样本的频率分布估计总体的分布,会用样本的数字特征估计总体的数字特征.3.样本数字特征及频率分布直方图为高考热点.有关统计内容及方法主要以选择题、填空题的形式呈现,分值约为5分,属于容易题;抽样方法和各种统计图表与概率的有关内容相结合也会出现在解答题中,分值约为13分,属于中档题.
破考点
【考点集训】
考点一 随机抽样
1.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150 C.200 D.250
答案 A
2.(2018课标Ⅲ文改编,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和分层抽样,则最合适的抽样方法是 .
答案 分层抽样
考点二 统计图表
3.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123 C.137 D.167
答案 C
4.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:
0
8
9
1
2
5
8
2
0
0
3
3
8
3
1
2
则这组数据的中位数是( )
A.19 B.20 C.21.5 D.23
答案 B
5.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a= ;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .
答案 (1)3 (2)6 000
6.(2014广东文,17,13分)某车间20名工人年龄数据如下表:
年龄(岁)
工人数(人)
19
1
28
3
29
3
30
5
31
4
32
3
40
1
合计
20
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解析 (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.
(2)这20名工人年龄的茎叶图如下:
1
2
3
4
9
8 8 8 9 9 9
0 0 0 0 0 1 1 1 1 2 2 2
0
(3)这20名工人年龄的平均数 x=120×(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s2=120×[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.
考点三 用样本估计总体
7.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解析 (1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
炼技法
【方法集训】
方法1 频率分布直方图的应用
1.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;
(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.
解析 (1)由(2a+3a+6a+7a+2a)×10=1,解得a=1200=0.005.
(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.
成绩落在[60,70)中的学生人数为3×0.005×10×20=3.
(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),
其中2人的成绩都在[60,70)中的基本事件有3个:
(B1,B2),(B1,B3),(B2,B3),故所求概率为P=310.
2.1995年联合国教科文组织宣布每年的4月23日为世界读书日,主旨宣言为“希望散居在全球各地的人们,都能享受阅读带来的乐趣,都能尊重和感谢为人类文明做出巨大贡献的文学、文化、科学思想的大师们,都能保护知识产权”.为了解大学生课外阅读情况,现从某高校随机抽取100名学生,将他们一年课外阅读量(单位:本)的数据分成7组[20,30),[30,40),……,[80,90),并整理得到频率分布直方图(如图):
(1)估计课外阅读量小于60本的人数;
(2)已知课外阅读量在[20,30),[30,40),[40,50)内的学生人数比为2∶3∶5.为了解学生阅读课外书的情况,现从阅读量在[20,40)内的学生中随机抽取2人进行座谈,求2人分别在不同组的概率;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计100名学生该年课外阅读量的平均数在第几组(只需写出结论).
解析 (1)由题图,计算得课外阅读量小于60本的人数大约为100-100×10×(0.04+0.02+0.02)=20.
(2)由已知条件可知[20,50)内的人数为100-100×10×(0.04+0.02+0.02+0.01)=10,
则[20,30)内的人数为2,[30,40)内的人数为3,[40,50)内的人数为5.
设[20,30)内的2人分别为a,b,[30,40)内的3人分别为c,d,e.
设事件A为“2人分别在不同组”.
从[20,40)内的学生中随机选取2人包含(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10个基本事件,而事件A包含(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),共6个基本事件.
所以P(A)=610=35.
(3)第五组.
方法2 样本的数字特征及用其估计总体的数字特征
3.某市的一个义务植树点统计了近10年栽种侧柏和银杏的数据(单位:株),制表:
年份
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
侧柏
3 200
3 600
3 300
3 900
3 500
3 300
3 900
3 600
4 100
4 000
银杏
3 400
3 300
3 600
3 600
3 700
4 200
4 400
3 700
4 200
4 200
(1)根据表中数据写出这10年内栽种银杏数量的中位数,并计算这10年栽种银杏数量的平均数;
(2)从统计的数据中,在栽种侧柏与银杏数量之差的绝对值不小于300株的年份中,任意抽取2年,求恰有1年栽种侧柏数量比银杏数量多的概率.
解析 (1)这10年栽种银杏数量从小到大排列为3 300,3 400,3 600,3 600,3 700,3 700,4 200,4 200,4 200,4 400,故中位数为3 700,平均数为3 830.
(2)栽种侧柏与银杏数量之差绝对值不小于300株的年份有
2009,2010,2011,2013,2014,共5年.
从中任意抽取2年有(2 009,2 010),(2 009,2 011),(2 009,2 013),(2 009,2 014),(2 010,2 011),(2 010,2 013),(2 010,2 014),(2 011,2 013),(2 011,2 014),(2 013,2 014),共10种情况.
恰有1年栽种侧柏数量比银杏数量多的有(2 009,2 010),(2 009,2 013),(2 009,2 014),(2 010,2 011),(2 011,2 013),(2 011,2 014),共6种情况.
所以所求概率P=610=35.
故恰有1年栽种侧柏数量比银杏数量多的概率为35.
4.某网站从春节期间参与收发网络红包的手机用户中随机抽取10 000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),……,[50,60],并整理得到如下频率分布直方图:
(1)求a的值;
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率;
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
解析 (1)根据频率分布直方图可得10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)样本中年龄低于40岁的频率为
10×(0.01+0.035+0.03)=0.75.
所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率为0.75.
(3)春节期间参与收发网络红包的手机用户的平均年龄估计为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5岁.
过专题
【五年高考】
A组 自主命题·北京卷题组
考点一 随机抽样
(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A.90 B.100 C.180 D.300
答案 C
考点二 统计图表
1.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到频率分布直方图如图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解析 (1)由用水量的频率分布直方图知,
该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,可得w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
思路分析 第(1)问,需要计算该市居民月用水量在各区间内的频率,根据样本的频率分布直方图即可获解.
第(2)问,由月用水量的频率分布直方图和w=3可得居民该月用水费用的数据分组与频率分布表,由此可估计该市居民该月的人均水费.
难点突破 第(2)问本质上是考查加权平均数的概念,这个权重就是频率,所以结合第(1)问和加权平均数的概念,就可以算出人均水费.
评析本题考查了频率分布直方图及用样本估计总体,属于中档题.
2.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18)
2
合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)
解析 (1)根据频数分布表知100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)由频数分布表知课外阅读时间落在[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085.
课外阅读时间落在[8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125.
(3)样本中的100名学生该周课外阅读时间的平均数在第4组.
思路分析 (1)用间接法求出一周课外阅读时间少于12小时的频率,用频率估计概率.
(2)由小矩形的高=频率组距,求a,b的值.
(3)利用平均数公式求得数据的平均数,即可得答案.
解后反思 本题考查概率与统计中的基本概念、平均数的估计、直方图横纵坐标的含义等.坐标系中横坐标是随机变量的取值范围,纵坐标与区间大小的乘积,也就是每个矩形的面积,代表随机变量位于这个区间的频率.
考点三 用样本估计总体
(2011北京,17,13分)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.
(1)如果X=8,求乙组同学植树棵数的平均数和方差;
(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y的分布列和数学期望.注:方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数
解析 (1)当X=8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为x=8+8+9+104=354;
方差为
s2=14×8-3542+8-3542+9-3542+10-3542=1116.
(2)当X=9时,由茎叶图可知,甲组同学的植树棵数是9,9,11,11;乙组同学的植树棵数是9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y的可能取值为17,18,19,20,21.事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P(Y=17)=216=18.
同理可得P(Y=18)=14;P(Y=19)=14;P(Y=20)=14;P(Y=21)=18.
所以随机变量Y的分布列为
Y
17
18
19
20
21
P
18
14
14
14
18
EY=17×P(Y=17)+18×P(Y=18)+19×P(Y=19)+20×P(Y=20)+21×P(Y=21)=17×18+18×14+19×14+20×14+21×18=19.
失分警示 (1)因不理解茎叶图的概念,求方差时计算出错等原因而失分.
(2)因算错随机变量的值以及相对应的概率,算错随机变量的期望等原因而失分.
评析本题考查了茎叶图的概念、平均数、方差的求法,随机变量的分布列和期望的求法.考查概率统计思想,数据处理能力和运算能力.解题的关键是准确地从茎叶图中读取数据,把握好随机变量取的每个值所对应的事件,从而准确得到随机变量的分布列.本题所考知识点多,运算量大,属于中等难度题.
B组 统一命题、省(区、市)卷题组
考点一 随机抽样
1.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
图1
图2
A.200,20 B.100,20 C.200,10 D.100,10
答案 A
2.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
答案 18
3.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4 800 件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为 件.
答案 1 800
考点二 统计图表
1.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
2.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案 A
3.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .
8
9 9
9
0 1 1
答案 90
4.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100 cm.
答案 24
5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
解析 (1)由频率分布直方图,可知月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1),知100位居民月均用水量不低于3吨的频率为 0.06+0.04+0.02=0.12,
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,
解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
思路分析 (1)通过各组频率之和为1,求出a的值.
(2)利用样本的频率来估计总体的数字特征.
评析本题考查了样本数据的数字特征,及利用样本的数字特征估计总体的数字特征,同时考查了学生的运算能力.
6.(2014广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.
根据上述数据得到样本的频率分布表如下:
分组
频数
频率
[25,30]
3
0.12
(30,35]
5
0.20
(35,40]
8
0.32
(40,45]
n1
f1
(45,50]
n2
f2
(1)确定样本频率分布表中n1,n2, f1和f2的值;
(2)根据上述频率分布表,画出样本频率分布直方图;
(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.
解析 (1)n1=7,n2=2, f1=0.28, f2=0.08.
(2)样本频率分布直方图如图所示.
(3)根据样本频率分布直方图,得每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,
所以4人中,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4.
考点三 用样本估计总体
(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1 035美元为低收入国家;人均GDP为1 035~4 085美元为中等偏下收入国家;人均GDP为4 085~12 616美元为中等偏上收入国家;人均GDP不低于12 616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:
行政区
区人口占城市人口比例
区人均GDP(单位:美元)
A
25%
8 000
B
30%
4 000
C
15%
6 000
D
10%
3 000
E
20%
10 000
(1)判断该城市人均GDP是否达到中等偏上收入国家标准;
(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.
解析 (1)设该城市人口总数为a,则该城市人均GDP为
8 000×0.25a+4 000×0.30a+6 000×0.15a+3 000×0.10a+10 000×0.20aa
=6 400.因为6 400∈[4 085,12 616),
所以该城市人均GDP达到了中等偏上收入国家标准.
(2)“从5个行政区中随机抽取2个”的所有的基本事件是{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共10个.
设事件“抽到的2个行政区人均GDP都达到中等偏上收入国家标准”为M,则事件M包含的基本事件是{A,C},{A,E},{C,E},共3个,所以所求概率为P(M)=310.
C组 教师专用题组
(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
答案 D
【三年模拟】
一、选择题(每小题5分,共10分)
1.(2018北京东城二模,6)某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图,如图所示.
甲地区
乙地区
若甲地区和乙地区用户满意度评分的中位数分别为m1,m2,标准差分别为s1,s2,则下面正确的是( )
A.m1>m2,s1>s2 B.m1>m2,s1s2
答案 D
2.(2017北京海淀二模,6)北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( )
A.第一季度 B.第二季度 C.第三季度 D.第四季度
答案 B
二、填空题(每小题5分,共10分)
3.(2018北京门头沟一模,10)某高中高一、高二、高三三个年级的人数分别为300,300,400,通过分层抽样从中抽取40人进行问卷调查,现在从答卷中随机抽取一张,恰好是高三学生的答卷的概率是 .
答案 25
4.(2017北京东城二模,11)如图所示的茎叶图记录了甲,乙两班各六名同学一周的课外阅读时间(单位:小时),已知甲班数据的平均数为13,乙班数据的中位数为17,那么x= ;y= .
甲
乙
8 9
0
7 6
3 x 5
1
9 y 6
0
2
1
答案 3;8
三、解答题(共90分)
5.(2018北京石景山一模,16)抢“微信红包”已经成为中国百姓欢度春节时非常喜爱的一项活动.小明收集班内20名同学今年春节期间抢到的红包金额x(元)如下(四舍五入取整数):
102 52 41 121 72
162 50 22 158 46
43 136 95 192 59
99 22 68 98 79
对这20个数据进行分组,各组的频数如下:
组别
红包金额分组
频数
A
0≤x<40
2
B
40≤x<80
9
C
80≤x<120
m
D
120≤x<160
3
E
160≤x<200
n
(1)写出m,n的值,并回答这20名同学抢到的红包金额的中位数落在哪个组别;
(2)记C组红包金额的平均数与方差分别为v1、s12,E组红包金额的平均数与方差分别为v2、s22,试分别比较v1与v2、s12与s22的大小;(只需写出结论)
(3)从A,E两组的所有数据中任取2个数据,记这2个数据差的绝对值为ξ,求ξ的分布列和数学期望.
解析 (1)m=4,n=2,落在B组.
(2)v1x2.
8.(2017北京朝阳二模,16)从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图.
(1)求a的值;
(2)假设同组中的每个数据用该组区间的中点值代替,估计该市中学生中全体男生的平均身高;
(3)从该市的中学生中随机抽取一名男生,根据直方图的信息,估计其身高在180 cm以上的频率.若从全市中学的男生(人数众多)中随机抽取3人,用X表示身高在180 cm以上的男生人数,求随机变量X的分布列和数学期望EX.
解析 (1)根据题意得(0.005×2+a+0.020×2+0.040)×10=1,解得a=0.010.
(2)设样本中男生身高的平均值为 x,则
x=145×0.05+155×0.1+165×0.2+175×0.4+185×0.2+195×0.05
=(145+195)×0.05+155×0.1+(165+185)×0.2+175×0.4
=17+15.5+70+70=172.5(cm).
所以估计该市中学生中全体男生的平均身高为172.5 cm.
(3)从该市的中学生中随机抽取一名男生,其身高在180 cm以上的概率为14.
由已知得,随机变量X的可能取值为0,1,2,3.
P(X=0)=C30140·343=2764,
P(X=1)=C31141·342=2764,
P(X=2)=C32142·341=964,
P(X=3)=C33143·340=164.
随机变量X的分布列为
X
0
1
2
3
P
2764
2764
964
164
因为X~B3,14,
所以EX=3×14=34.
9.(2017北京石景山一模,16)某超市从甲、乙两种酸奶的日销售量(单位:箱)的1 200个数据(数据均在区间(0,50]内)中,按照5%的比例进行分层抽样,统计结果按(0,10],(10,20],(20,30],(30,40],(40,50]分组,整理如图:
图甲
图乙
(1)写出频率分布直方图(图乙)中a的值,记所抽取样本中甲种酸奶与乙种酸奶日销售量的方差分别为s12,s22,试比较s12与s22的大小(只需写出结论);
(2)从甲种酸奶日销售量在区间(0,20]的数据样本中抽取3个,记在(0,10]内的数据个数为X,求X的分布列;
(3)估计1 200个日销售量数据中,数据在区间(0,10]中的个数.
解析 (1)由题图乙知10×(a+0.020+0.030+0.025+0.015)=1,解得a=0.010.
易知s12>s22.
(2)X的所有可能取值为1,2,3,
则P(X=1)=C41C22C63=15,
P(X=2)=C42C21C63=35,
P(X=3)=C43C20C63=15,
所以X的分布列为
X
1
2
3
P
15
35
15
(3)由题图甲知,甲种酸奶的数据共抽取了2+3+4+5+6=20个,
其中有4个数据在区间(0,10]内,
又因为分层抽样共抽取了1 200×5%=60个数据,
所以乙种酸奶的数据共抽取了60-20=40个,
由(1)知,乙种酸奶的日销售量数据在区间(0,10]内的频率为0.1,
故乙种酸奶的日销售量数据在区间(0,10]内的有40×0.1=4个.
故抽取的60个数据中,共有4+4=8个数据在区间(0,10]内.
所以估计1 200个数据中,在区间(0,10]内的数据有860×1 200=160个.
10.(2019届北京五中期中,16)2014年12月28日开始,北京市公共电汽车和地铁按照里程分段计价.具体如下表.(不考虑公交卡折扣情况)
乘公共电汽车方案
10公里(含)内2元;
10公里以上部分,每增加1元可乘坐5公里(含)
乘坐地铁方案(不含机场线)
6公里(含)内3元;
6公里至12公里(含)4元;
12公里至22公里(含)5元;
22公里至32公里(含)6元;
32公里以上部分,每增加1元可乘坐20公里(含)
已知在北京地铁四号线上,任意一站到陶然亭站的票价不超过5元,现从那些只乘坐四号线地铁,且在陶然亭站出站的乘客中随机选出120人,他们乘坐地铁的票价统计如图所示.
(1)如果从那些只乘坐四号线地铁,且在陶然亭站出站的乘客中任选1人,试估计此人乘坐地铁的票价小于5元的概率;
(2)已知选出的120人中有6名学生,且这6人乘坐地铁的票价情况恰好与按票价从这120人中分层抽样所选的结果相同,现从这6人中随机选出2人,求这2人的票价之和恰好为8元的概率;
(3)小李乘坐地铁从某地到陶然亭的票价是5元,返程时,小李乘坐某路公共电汽车所花交通费也是5元,假设小李往返过程中乘坐地铁和公共电汽车的路程均为s公里,试写出s的取值范围.(只需写出结论)
解析 (1)记事件A为“此人乘坐地铁的票价小于5元”,
由统计图可知,120人中票价为3元、4元、5元的人数分别为60,40,20,所以票价小于5元的有60+40=100(人),
故120人中票价小于5元的频率是100120=56,
所以估计此人乘坐地铁的票价小于5元的概率P(A)=56.
(2)记事件B为“这2人的票价之和恰好为8元”,
由统计图得,120人中票价为3元、4元、5元的人数比为60∶40∶20=3∶2∶1,
则6名学生中票价为3元、4元、5元的人数分别为3,2,1,
记票价为3元的同学为a,b,c,票价为4元的同学为d,e,票价为5元的同学为f,
从这6人中随机选出2人,所有可能的选出结果共有15种:
(a,b),(a,c),(a,d),(a,e),(a,f),
(b,c),(b,d),(b,e),(b,f),
(c,d),(c,e),(c,f),
(d,e),(d,f),
(e,f),
其中事件B的结果有4种:(a,f),(b,f),(c,f),(d,e),
所以这2人的票价之和恰好为8元的概率P(B)=415.
(3)s∈(20,22].
(乘公共电汽车方案里程:10公里(含)内2元,
10公里以上部分,每增加1元可乘坐5公里(含),
∴10+5×2