- 1.53 MB
- 2021-05-11 发布
10
.
4
变量间的相关关系、统计案例
-
2
-
-
3
-
知识梳理
考点自测
1
.
变量间的相关关系
(1)
定义
:
当自变量取值一定时
,
因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
.
与函数关系不同
,
相关关系是一种
.
(2)
散点图
:
表示具有相关关系的两个变量的一组数据的图形叫做散点图
,
它可直观地判断两个变量的关系是否可以用线性关系表示
.
若这些散点分布在从左下角到右上角的区域
,
则称两个变量
;
若这些散点分布在从左上角到右下角的区域
,
则称两个变量
.
(3)
线性相关关系、回归直线
:
如果散点图中点的分布从整体上看大致在
,
就称这两个变量之间具有线性相关关系
,
这条直线叫做回归直线
.
非确定性关系
正相关
负相关
一条直线附近
-
4
-
知识梳理
考点自测
(4)
非线性相关
:
若散点图上所有点看上去都在
附近波动
,
则称此相关为非线性相关
.
此时
,
可以用
来拟合
.
(5)
不相关
:
如果所有的点在散点图中
,
那么称变量间是不相关的
.
某条曲线
一条曲线
没有显示任何关系
-
5
-
知识梳理
考点自测
2
.
两个变量的线性相关
(1)
从散点图上看
,
如果这些点从整体上看大致分布在通过散点图中心的一条直线附近
,
称两个变量之间具有
,
这条直线叫做
.
线性相关关系
回归直线
-
6
-
知识梳理
考点自测
当
r>
0
时
,
表明两个变量正相关
;
当
r<
0
时
,
表明两个变量负相关
.
r
的绝对值越接近于
1,
表明两个变量的线性相关性越强
.r
的绝对值越接近于
0
时
,
表明两个变量之间几乎不存在线性相关关系
.
通常当
|r|
大于
0
.
75
时
,
认为两个变量有很强的线性相关性
.
-
7
-
知识梳理
考点自测
-
8
-
知识梳理
考点自测
3
.
独立性检验
(1)
分类变量
:
变量的不同
“
值
”
表示个体所属的不同类别
,
像这类变量称为分类变量
.
(2)2
×
2
列联表
:
假设有两个分类变量
X
和
Y
,
它们的值域分别为
{
x
1
,
x
2
}
和
{
y
1
,
y
2
},
其样本频数列联表
(
称
2
×
2
列联表
)
为
:
(3)
用
K
2
的大小可以决定是否拒绝原来的统计假设
H
0
,
若
K
2
值较大
,
就拒绝
H
0
,
即拒绝事件
A
与
B
无关
.
-
9
-
知识梳理
考点自测
1
.
判断下列结论是否正确
,
正确的画
“
√
”,
错误的画
“
×
”
.
(1)
相关关系与函数关系都是一种确定性的关系
,
也是一种因果关系
.
(
)
(2)
利用散点图可以直观判断两个变量的关系是否可以用线性关系表示
.
(
)
(3)
只有两个变量有相关关系
,
所得到的回归模型才有预测价值
.
(
)
(4)
事件
X
,
Y
关系越密切
,
则由观测数据计算得到的
K
2
的观测值越大
.
(
)
(5)
通过回归方程
可以估计和观测变量的取值和变化趋势
.
(
)
×
√
√
√
√
-
10
-
知识梳理
考点自测
A
-
11
-
知识梳理
考点自测
3
.
(2017
辽宁葫芦岛一模
,
文
8)
广告投入对商品的销售额有较大影响
.
某电商对连续
5
个年度的广告费和销售额进行统计
,
得到统计数据如下表
(
单位
:
万元
):
A.101
.
2
万元
B.108
.
8
万元
C.111
.
2
万元
D.118
.
2
万元
C
-
12
-
知识梳理
考点自测
4
.
在一次对性别与说谎是否相关的调查中
,
得到如下数据
:
根据表中数据
,
得到如下结论正确的一项是
(
)
A.
在此次调查中有
95%
的把握认为是否说谎与性别有关
B.
在此次调查中有
99%
的把握认为是否说谎与性别有关
C.
在此次调查中有
99
.
5%
的把握认为是否说谎与性别有关
D.
在此次调查中没有充分的证据显示说谎与性别有关
D
-
13
-
知识梳理
考点自测
③
-
14
-
考点一
考点二
考点三
相关关系的判断
例
1
(1)(2017
河南洛阳模拟
)
为研究语文成绩和英语成绩之间是否具有线性相关关系
,
统计某班学生的两科成绩得到如图所示的散点图
(
x
轴、
y
轴的单位长度相同
),
用回归直线方程
近似地刻画其相关关系
,
根据图形
,
以下结论最有可能成立的是
(
)
A.
线性相关关系较强
,
b
的值为
1
.
25
B.
线性相关关系较强
,
b
的值为
0
.
83
C.
线性相关关系较强
,
b
的值为
-
0
.
87
D.
线性相关关系较弱
,
无研究价值
B
-
15
-
考点一
考点二
考点三
(2)
甲、乙、丙、丁四名同学各自对
A
,
B
两个变量的线性相关性做试验
,
并用回归分析方法分别求得相关系数
r
与残差平方和
m
如下表
:
则哪名同学的试验结果体现
A
,
B
两个变量有更强的线性相关性
(
)
A.
甲
B.
乙
C.
丙
D.
丁
D
-
16
-
考点一
考点二
考点三
解析
:
(1)
由散点图可以看出两个变量所构成的点在一条直线附近
,
所以线性相关关系较强
,
且应为正相关
,
所以回归直线方程的斜率应为正数
,
且从散点图观察
,
回归直线方程的斜率应该比
y=x
的斜率要小一些
,
综上可知应选
B
.
(2)
在验证两个变量之间的线性相关关系时
,
相关系数的绝对值越接近
1,
相关性越强
,
在四个选项中只有丁的相关系数最大
;
残差平方和越小
,
相关性越强
,
只有丁的残差平方和最小
,
综上可知丁的试验结果体现了
A
,
B
两个变量有更强的线性相关性
,
故选
D
.
-
17
-
考点一
考点二
考点三
思考
如何判断两个变量有无相关关系
?
解题心得
判断两个变量有无相关关系有两个方法
:
一是根据散点图
,
具有很强的直观性
,
直接得出两个变量是正相关或负相关
;
二是计算相关系数法
,
这种方法能比较准确地反映相关程度
,
相关系数的绝对值越接近
1,
相关性就越强
,
相关系数就是描述相关性强弱的
.
-
18
-
考点一
考点二
考点三
对点训练
1
(1)
对四组数据进行统计
,
获得如图所示的散点图
,
关于其相关系数的比较
,
正确的是
(
)
A.
r
2