- 209.92 KB
- 2021-06-19 发布
重点强化训练(五) 统计与统计案例
(对应学生用书第291页)
A组 基础达标
(建议用时:30分钟)
一、选择题
1.(2017·石家庄模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为
( ) 【导学号:00090343】
A.101 B.808
C.1 212 D.2 012
B [由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有=,解得N=808.]
2.设某大学的女生体重y(单位:kg)写身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
D [∵0.85>0,∴y与x正相关,∴A正确;
∵回归直线经过样本点的中心(,),∴B正确;
∵Δy=0.85(x+1)-85.71-(0.85x-85.71)=0.85,
∴C正确.]
3.亚冠联赛前某参赛队准备在甲、乙两名球员中选一人参加比赛.如图9所示的茎叶图记录了一段时间内甲、乙两人训练过程中的成绩,若甲、乙两名球员的平均成绩分别是x1,x2,则下列结论正确的是( )
图9
A.x1>x2,选甲参加更合适
B.x1>x2,选乙参加更合适
C.x1=x2,选甲参加更合适
D.x1=x2,选乙参加更合适
A [根据茎叶图可得甲、乙两人的平均成绩分别为x1≈31.67,x2≈24.17,从茎叶图来看,甲的成绩比较集中,而乙的成绩比较分散,因此甲发挥得更稳定,选甲参加比赛更合适.]
4.(2018·黄山模拟)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份)
1
2
3
4
5
y(万盒)
5
5
6
6
8
若x,y线性相关,线性回归方程为y=0.7x+a,则估计该制药厂6月份生产甲胶囊产量为( )
【导学号:00090344】
A.8.1万盒 B.8.2万盒
C.8.9万盒 D.8.6万盒
A [由题意知=3,=6,则a=-0.7=3.9,∴x=6时,y=8.1.]
5.(2018·郑州模拟)利用如图10所示算法在平面直角坐标系上打印一系列点,则打印的点在圆x2+y2=10内的个数为( )
图10
A.2 B.3
C.4 D.5
B [执行题中的程序框图,打印的点的坐标依次为(-3,6),(-2,5),(-1,4),(0,3),(1,2),(2,1),其中点(0,3),(1,2),(2,1)位于圆x2+y2=10内,因此打印的点位于圆x2+y2=10内的共有3个.]
二、填空题
6.在某市“创建文明城市”
活动中,对800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图11),但是年龄组为[25,30)的数据不慎丢失,据此估计这800名志愿者年龄在[25,30)内的人数为________.
图11
160 [设年龄在[25,30)内的志愿者的频率是P,则有5×0.01+P+5×0.07+5×0.06+5×0.02=1,解得P=0.2.
故估计这800名志愿者年龄在[25,30)内的人数是800×0.2=160.]
7.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
女
男
总计
喜爱
40
20
60
不喜爱
20
30
50
总计
60
50
110
试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.
参考附表:
P(χ2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
99% [假设喜爱该节目和性别无关,分析列联表中数据,可得χ2=≈7.822>6.635,
所以有99%的把握认为“喜爱《开门大吉》节目与否和性别有关”.]
8.(2017·太原模拟)数列{an}满足an=n,阅读如图12所示的算法框图,运行相应的程序,若输入n=5,an=n,x=2的值,则输出的结果v=________.
图12
129 [该算法框图循环4次,各次v的值分别是14,31,64,129,故输出结果v=129.]
三、解答题
9.(2018·合肥模拟)全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n天监测空气质量指数(AQI),数据统计如下表:
空气质量指数(μg/m3)
[0,50]
(50,100]
(100,150]
(150,200]
(200,250]
空气质量等级
优
良
轻度污染
中度污染
重度污染
天数
20
40
m
10
5
(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;
图13
(2)由频率分布直方图,求该组数据的平均数与中位数;
(3)在空气质量指数分别为(50,100]和(150,200]的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A“两天空气质量等级都为良”发生的概率.
[解] (1)∵0.004×50=,∴n=100,
∵20+40+m+10+5=100,∴m=25.
=0.008;=0.005;=0.002;=0.001.2分
由此完成频率分布直方图,如图:
4分
(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95, 6分
∵[0,50)的频率为0.004×50=0.2,[50,100)的频率为0.008×50=0.4,
∴中位数为50+×50=87.5. 8分
(3)由题意知在空气质量指数为(50,100]和(150,200]的监测天数中分别抽取4天和1天, 9分
在所抽取的5天中,将空气质量指数为(50,100]的4天分别记为a,b,c,d;
将空气质量指数为(150,200]的1天记为e,从中任取2天的基本事件为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10个, 10分
其中事件A“两天空气质量等级都为良”包含的基本事件为
(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6个. 11分
所以P(A)==. 12分
10.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程y=bt+a;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程y=bt+a中,b=,a=-b .
[解] (1)列表计算如下:
这里n=5,=i==3,=i==7.2. 2分
又ltt=-n 2=55-5×32=10,
lty=iyi-n=120-5×3×7.2=12,
从而b===1.2,
a=-b=7.2-1.2×3=3.6,
故所求回归方程为y=1.2t+3.6. 7分
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y=1.2×6+3.6=10.8(千亿元). 12分
B组 能力提升
(建议用时:15分钟)
1. 如图14所示的算法框图,若输出k的值为6,则判断框内可填入的条件是( )
【导学号:00090345】
图14
A.s> B.s>
C.s> D.s>
C [第一次执行循环:s=1×=,k=8,s=应满足条件;
第二次执行循环:s=×=,k=7,s=应满足条件,排除选项D;
第三次执行循环:s=×=,k=6,不再满足条件,结束循环.
因此判断框中的条件为s>.]
2.(2017·西安调研)已知某产品连续4个月的广告费用x1(千元)与销售额y1(万元),经过对这些数据的处理,得到如下数据信息:
①i=18,i=14;
②广告费用x和销售额y之间具有较强的线性相关关系;
③回归直线方程y=bx+a中的b=0.8(用最小二乘法求得).那么,广告费用为6千元时,可预测销售额约为________万元.
4.7 [因为i=18,i=14,所以=4.5,=3.5,
因为回归直线方程y=bx+a中的b=0.8,
所以3.5=0.8×4.5+a,
所以a=-0.1,所以y=0.8x-0.1.
x=6时,可预测销售额约为4.7万元.]
3.某工厂36名工人的年龄数据如下表.
年龄
年龄
年龄
年龄
1 40
10 36
19 27
28 34
2 44
11 31
20 43
29 39
3 40
12 38
21 41
30 43
4 41
13 39
22 37
31 38
5 33
14 43
23 34
32 42
6 40
15 45
24 42
33 53
7 45
16 39
25 37
34 37
8 42
17 38
26 44
35 49
9 43
18 36
27 42
36 39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算(1)中样本的均值和方差s2;
(3)36名工人中年龄在-s与+s之间有多少人?所占的百分比是多少(精确到0.01%)?
[解] (1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,
所以所有样本数据的编号为4n-2(n=1,2,…,9),
其年龄数据为:44,40,36,43,36,37,44,43,37. 5分
(2)由均值公式知:==40,
由方差公式知:s2=[(44-40)2+(40-40)2+…+(37-40)2]=. 8分
(3)因为s2=,s=,
所以36名工人中年龄在-s和+s之间的人数等于年龄在区间[37,43]上的人数,
即40,40,41,…,39,共23人.
所以36名工人中年龄在-s和+s之间的人数所占的百分比为×100%≈63.89%. 12分