高考达标检测(五十二) 变量间的相关关系、统计案例
一、选择题
1.根据如下样本数据得到的回归方程为=x+,若=5.4,则x每增加1个单位,y就( )
x
3
4
5
6
7
y
4
2.5
-0.5
0.5
-2
A.增加0.9个单位 B.减少0.9个单位
C.增加1个单位 D.减少1个单位
解析:选B 由题意可得= (3+4+5+6+7)=5,
= (4+2.5-0.5+0.5-2)=0.9,
∵回归方程为=x+,=5.4,且回归直线过点(5,0.9),
∴0.9=5+5.4,解得=-0.9,
∴x每增加1个单位,y就减少0.9个单位 .
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,
a′ D.a′.故选C.
3.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y
(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知i=225,i=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
解析:选C 由题意可知=4x+,
又=22.5,=160,
因此160=22.5×4+,解得=70,
所以=4x+70.
当x=24时,=4×24+70=166.
4.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,得到如下列联表:
男
女
总计
喜欢
40
20
60
不喜欢
20
30
50
总计
60
50
110
由K2=,
得K2=≈7.822.
附表:
P(K2≥k0)
0.05
0.01
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”
C.有99%以上的把握认为“喜欢该节目与性别有关”
D.有99%以上的把握认为“喜欢该节目与性别无关”
解析:选C 根据K2的值,对照附表可得P(K2≥k0)≈0.01,
所以有99%以上的把握认为“喜欢该节目与性别有关”.
5.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y
(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% B.67%
C.79% D.84%
解析:选D ∵y与x具有线性相关关系,满足回归方程=0.6x+1.2,
该城市居民人均工资为=5,
∴可以估计该城市的职工人均消费水平=0.6×5+1.2=4.2,
∴可以估计该城市人均消费额占人均工资收入的百分比为=84%.
6.某研究机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x
4
6
8
10
识图能力y
3
5
6
8
由表中数据,求得线性回归方程为=x+,若某儿童的记忆能力为12,则他的识图能力为( )
A.7 B.9.5
C.10 D.12
解析:选B 由表中数据得==7,==,
由(,)在直线=x+上,得=-,
即线性回归方程为=x-.
当x=12时,=×12-=9.5,即他的识图能力为9.5.
二、填空题
7.(2018·阜阳质检)某班主任对全班30名男生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
12
8
20
不喜欢玩电脑游戏
2
8
10
总计
14
16
30
该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.
解析:计算得K2的观测值k=≈4.286>3.841,
则推断犯错误的概率不超过0.05.
答案:0.05
8.某品牌牛奶的广告费用x与销售额的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为7万元时销售额为________万元.
解析:因为==,
==42,
由题意可得回归方程为=9.4x+,
因为回归直线一定经过样本点中心(,)
所以42=9.4×+,解得=9.1,
所以回归方程为=9.4x+9.1,
当x=7时,销售额为y=9.4×7+9.1=74.9(万元).
答案:74.9
9.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程和相关系数r,分别得到以下四个结论:
①y=2.347x-6.423,且r=-0.928 4;
②y=-3.476x+5.648,且r=-0.953 3;
③y=5.437x+8.493,且r=0.983 0;
④y=-4.326x-4.578,且r=0.899 7.
其中不正确的结论的序号是________.
解析:对于①,y=2.347x-6.423,且r=-0.928 4,
线性回归方程符合正相关的特征,r>0,∴①错误;
对于②,y=-3.476x+5.648,且r=-0.953 3,
线性回归方程符合负相关的特征,r<0,∴②正确;
对于③,y=5.437x+8.493,且r=0.983 0,
线性回归方程符合正相关的特征,r>0,∴③正确;
对于④,y=-4.326x-4.578,且r=0.899 7,
线性回归方程符合负相关的特征,r<0,④错误.
综上,①④错误.
答案:①④
三、解答题
10.(2018·惠州调研)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1∶3,且成绩分布在[40,100],分数在80以上(含80)的同学获奖.按文、理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示.
(1)求a的值,并计算所抽取样本的平均值(同一组中的数据用该组区间的中点值作代表);
(2)填写下面的2×2列联表,并判断在犯错误的概率不超过0.05的前提下能否认为“获奖与学生的文、理科有关”.
文科生
理科生
总计
获奖
5
不获奖
总计
200
附表及公式:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
K2=.
解:(1)a=×[1-(0.01+0.015+0.03+0.015+0.005)×10]=0.025,
=45×0.1+55×0.15+65×0.25+75×0.3+85×0.15+95×0.05=69.
(2)由频率分布直方图知样本中获奖的人数为40,不获奖的人数为160,2×2列联表如下:
文科生
理科生
总计
获奖
5
35
40
不获奖
45
115
160
总计
50
150
200
因为K2=≈4.167>3.841,
所以在犯错误的概率不超过0.05的前提下能认为“获奖与学生的文、理科有关”.
11.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1:无酒状态
停车距离d(米)
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
频数
26
m
n
8
2
表2:酒后状态
平均每毫升血液酒精含量x(毫克)
10
30
50
70
90
平均停车距离y(米)
30
50
60
70
90
已知表1数据的中位数估计值为26,回答以下问题.
(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程=x+;
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?
(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),
其回归直线=x+的斜率和截距的最小二乘估计分别为
==,=-)
解:(1)依题意,得m=50-26,解得m=40,
又m+n+36=100,解得n=24.
故停车距离的平均数为
15×+25×+35×+45×+55×=27.
(2)依题意,可知=50,=60,
iyi=10×30+30×50+50×60+70×70+90×90=17 800,
=102+302+502+702+902=16 500,
所以==0.7,
=60-0.7×50=25,
所以回归直线方程为=0.7x+25.
(3)由(1)知当y>81时认定驾驶员是“醉驾”.令>81,得0.7x+25>81,解得x>80,
当每毫升血液酒精含量大于80毫克时认定为“醉驾”.
某公司为了准确把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如表所示:
x
1
2
3
4
y
12
28
42
56
(1)在图中画出表中数据的散点图;
(2)根据(1)中的散点图拟合y与x的回归模型,并用相关系数加以说明;
(3)建立y关于x的回归方程,预测第5年的销售量约为多少?
参考数据: ≈32.66,≈2.24,iyi=418.
参考公式:相关系数r=,回归方程=+x中斜率和截距的最小二乘法估计公式分别为
==,=-.
解:(1)作出散点图如图所示.
(2)由(1)的散点图可知,各点大致分布在一条直线附近,由题中所给数据及参考数据得:
=,=,=30, ≈32.66,
(xi-)(yi-)=iyi-i=418-×138=73,
= = =≈2.24,
∴r==≈0.997 8.
∵y与x的相关系数近似为0.997 8,说明y与x的线性相关程度相当大,
∴可以用线性回归模型拟合y与x的关系.
(3)由(2)知,iyi-4 =73,-42=5,
∴=,=- =-×=-2,
故y关于x的回归直线方程为=x-2.
当x=5时,=×5-2=71,
∴第5年的销售量约为71万件.