- 113.00 KB
- 2021-04-15 发布
第一章 统计案例(B)
一、选择题
1、对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )
A.k越大,推断“X与Y有关系”,犯错误的概率越大
B.k越小,推断“X与Y有关系”,犯错误的概率越大
C.k越接近于0,推断“X与Y无关”,犯错误的概率越大
D.k越大,推断“X与Y无关”,犯错误的概率越小
2、对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1,说明x与y之间完全相关
D.样本相关系数r∈(-1,1)
3、有下列说法:
①随机误差是引起预报值与真实值之间的误差的原因之一;
②残差平方和越小,预报精度越高;
③在独立性检验中,通过二维条形图可以粗略判断两个分类变量是否有关系.
其中真命题的个数是( )
A.0 B.1 C.2 D.3
4、下列属于相关关系的是( )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
5、经过对K2的统计量的研究,得到了若干个临界值,当K2≤2.706时,我们认为事件A与B( )
A.在犯错误的概率不超过0.05的前提下有关系
B.在犯错误的概率不超过0.01的前提下有关系
C.没有充分理由认为A与B有关系
D.不能确定
6、由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的线性回归方程为 = x+ ,那么下面说法不正确的是( )
A.直线 = x+ 必经过点(,)
B.直线 = x+ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线 = x+ 的斜率为
D.直线 = x+ 和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-( xi+ )]2是该坐标平面上所有直线与这些点偏差中最小的
7、下列是x与y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y关于x的线性回归方程 = x+ ,对应的直线必过点( )
A.(,4) B.(,2)
C.(2,2) D.(1,2)
8、为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校学生中随机抽取了50名学生,得到如下列联表:
喜欢数学
不喜欢数学
合计
男
13
10
23
女
7
20
27
合计
20
30
50
根据表中数据,得到k=≈4.844>3.841,你认为性别与是否喜欢数学课程之间有关系,这种判断犯错误的概率不超过( )
A.0 B.0.05 C.0.01 D.1
9、两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( )
A.模型1的相关指数R2为0.98
B.模型2的相关指数R2为0.85
C.模型3的相关指数R2为0.61
D.模型4的相关指数R2为0.31
10、下列说法中正确的有( )
①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上
A.①② B.②③ C.①③ D.①②③
11、利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
如果K2≥5.024,那么就有把握认为“X与Y有关系”的百分比为( )
A.25% B.75% C.2.5% D.97.5%
12、一位母亲记录了儿子3~9岁的身高,由此建立的身高(cm)与年龄(岁)的回归模型为 =7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
二、填空题
13、下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②回归方程 = x+ 必过点(,);
③曲线上的点与该点的坐标之间具有相关关系;
④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%.
其中错误的是________.(填序号)
14、对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为______________.
15、若两个分类变量X与Y的列联表为:
y1
y2
总计
x1
10
15
25
x2
40
16
56
总计
50
31
81
则“X与Y之间有关系”这个结论出错的可能性为________.
16、如果散点图中所有样本点都在一条直线上,解释变量和预报变量的关系是__________,残差平方和是__________.
三、解答题
17、在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:
价格x
14
16
18
20
22
需求量y
12
10
7
5
3
求出y对x的线性回归方程,并说明拟合效果的好坏.
18、某地区10名健康儿童头发和血液中的硒含量(1 000 ppm)如下表所示:
血硒
74
66
88
69
91
73
66
96
58
73
发硒
13
10
13
11
16
9
7
14
5
10
(1)画出散点图;
(2)求回归方程;
(3)若某名健康儿童的血硒含量为94(1 000 ppm),预测他的发硒含量.
19、在研究水果辐照保鲜效果问题时,经统计得到如下数据:
未腐烂
发生腐烂
合计
未辐照
251
249
500
已辐照
203
297
500
合计
454
546
1 000
问:辐照保鲜措施对水果保鲜是否有效?
20、 研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药物有无副作用.
有恶心
无恶心
合计
给药A
15
35
50
给安慰剂
5
45
50
合计
20
80
100
21、现对x、y有如下观测数据:
x
18
25
30
39
41
42
49
52
y
3
5
6
7
8
8
9
10
试求y对x的线性回归方程.
22、某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得到相应结论吗?请运用独立性检验进行判断.
以下是答案
一、选择题
1、B
2、D [相关系数r的范围是[-1,1].]
3、D
4、B
5、C
6、B [回归直线不一定过某个样本点,一定过样本点的中心(,).]
7、A [(,4)为样本点的中心,一定在回归直线上.]
8、B
9、A
10、C
11、D [k=5.024对应0.025是“X与Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.]
12、D [145.83 cm只是身高的预测值,不是精确值.]
二、填空题
13、③④
解析 ①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.
14、=-10+6.5x
解析 由题意知=2,=3, =6.5,所以 =- =3-6.5×2=-10,即回归直线的方程为 =-10+6.5x.
15、1%
解析 由列联表数据,可求得随机变量K2的观测值k=
≈7.227>6.635.
因为P(K2≥6.635)≈0.01,
所以“X与Y之间有关系”出错的可能性仅为1%.
16、线性函数关系 0
三、解答题
17、解 =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
x=142+162+182+202+222=1 660,
y=122+102+72+52+32=327,
xiyi=14×12+16×10+18×7+20×5+22×3=620,
所以 ==
==-1.15,
所以 =- =7.4+1.15×18=28.1,
所以线性回归方程为 =-1.15x+28.1,
列出残差表为:
yi- i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以 (yi- i)2=0.3, (yi-)2=53.2,
R2=1-≈0.994,
因而拟合效果较好.
18、解 (1)散点图如下图所示:
(2)根据回归方程的截距和斜率的最小二乘估计公式分别求得:
==
≈0.236,
=- x=10.8-0.236×75.4≈-6.99.
故所求回归方程为 =0.236x-6.99.
(3)当x=94时, =0.236×94-6.99≈15.2.
因此,当地儿童的血硒含量为94(1 000 ppm)时,该儿童的发硒含量约为15.2(1 000 ppm).
19、解 根据题中数据,利用公式,得K2的观测值k=≈9.295,因为9.295>7.879,因此在犯错误概率不超过0.005的前提下,认为辐照保鲜措施对水果保鲜有效.
20、解 由题意,问题可以归纳为独立检验.假设H0:服用该药物(A)与恶心(B)独立.为了检验假设H0,首先计算统计量K2的观测值k=≈6.25>5.024.即不能认为药物无恶心作用,也可以说,有97.5%的把握说该药物与副作用(恶心)有关.
21、解 可求得:=37,=7,x=11 920,
xiyi=2 257.
设回归方程为 = + x,
则 =
=
=≈0.19,
=- =7-0.19×37=-0.03.
∴回归方程为 =0.19x-0.03.
22、解 能.根据题目所给数据得到如下列联表:
哑
不哑
总计
聋
416
241
657
不聋
249
431
680
总计
665
672
1 337
根据列联表中数据得到K2的观测值
k=
≈95.291>10.828.
因此在犯错误的概率不超过0.001的前提下认为聋与哑有关系.