- 2.70 MB
- 2021-04-13 发布
回归分析的基本思想及其初步应用
考纲下载
1.
了解随机误差、残差、残差图的概念
.
2
.
会通过分析残差判断线性回归模型的拟合效果
.
3
.
掌握建立线性回归模型的步骤
.
知识复习
达标检测
题型探究
内容索引
知识复习
思考
某电脑公司有
5
名产品推销员,其工作年限与年推销金额数据如下表:
知识点一 线性回归模型
推销员编号
1
2
3
4
5
工作年限
x
/
年
3
5
6
7
9
推销金额
y
/
万元
2
3
3
4
5
请问如何表示推销金额
y
与工作年限
x
之间的相关关系?
y
关于
x
的线性回归方程是什么?
答案
画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系
.
梳理
(1)
函数关系是一
种
关系
,而相关关系是一
种
____
_
____
关系
.
(2)
回归分析是对
具有
关系
的两个变量进行统计分析的一种常用方法
.
确定性
非确定性
相关
(4)
线性回归模型
y
=
bx
+
a
+
e
,其中
a
和
b
是模型的未知参数,
e
称为
_____
,
自变量
x
称为
,
因变量
y
称为
.
随机
解释变量
误差
预报变量
知识点二 线性回归分析
答案
不一定
.
答案
越小越好
.
(2)
残差图法
残差
点
落
在水平的带状区域中,说明选用的模型比较合适
.
这样的带状区域的
宽度
,
说明模型拟合精度越高,回归方程的预报精度越高
.
比较均匀地
越窄
R
2
越接近于
1
知识点三 建立回归模型的基本步骤
1.
确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量
.
2.
画出解释变量和预报变量的散点图,观察它们之间的关系
(
如是否存在线性关系等
).
3.
由经验确定回归方程的类型
(
如观察到数据呈线性关系,则选用线性回归方程
).
4.
按一定规则
(
如最小二乘法
)
估计回归方程中的参数
.
5.
得出结果后分析残差图是否有异常
(
如个别数据对应残差过大,残差呈现不随机的规律性等
).
若存在异常,则检查数据是否有误,或模型是否合适等
.
1.
求线性回归方程前可以不进行相关性检验
.(
)
2.
在残差图中,纵坐标为残差,横坐标可以选为样本编号
.(
)
3.
利用线性回归方程求出的值是准确值
.(
)
×
√
×
[
思考辨析 判断正误
]
题型探究
例
1
某研究机构对高三学生的记忆力
x
和判断力
y
进行统计分析,得下表数据:
类型一 求线性回归方程
解
答
x
6
8
10
12
y
2
3
5
6
(1)
请画出上表数据的散点图
;
解
如图:
解答
(3)
试根据求出的线性回归方程,预测记忆力为
9
的同学的判断力
.
预测记忆力为
9
的同学的判断力约为
4.
解答
反思与感悟
(1)
求线性回归方程的基本步骤
①
列出散点图,从直观上分析数据间是否存在线性相关关系
.
④
写出线性回归方程并对实际问题作出估计
.
(2)
需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义
.
跟踪训练
1
假设关于某设备的使用年限
x
(
年
)
和所支出的维修费用
y
(
万元
)
有如下的统计数据:
解答
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
由此资料可知
y
对
x
呈线性相关关系
.
(1)
求线性回归方程;
解
由上表中的数据可得
(2)
求使用年限为
10
年时,该设备的维修费用为多少?
解答
即使用年限为
10
年时,该设备的维修费用约为
12.38
万元
.
命题角度
1
线性回归分析
类型二 回归分析
解答
求出
y
对
x
的线性回归方程,并说明拟合效果的程度
.
例
2
在一段时间内,某种商品的价格
x
元和需求量
y
件之间的一组数据为:
x
14
16
18
20
22
y
12
10
7
5
3
列出残差表:
所以回归模型的拟合效果很好
.
反思与感悟
(1)
该类题属于线性回归问题,解答此类题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数
R
2
来分析函数模型的拟合效果,在此基础上,借助线性回归方程对实际问题进行分析
.
(2)
刻画回归效果的三种方法
①
残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适
.
跟踪训练
2
关于
x
与
y
有如下数据:
解答
x
2
4
5
6
8
y
30
40
60
50
70
∴
(1)
的拟合效果好于
(2)
的拟合效果
.
例
3
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费
x
(
单位:千元
)
对年销售量
y
(
单位:
t)
和年利润
z
(
单位:千元
)
的影响
.
对近
8
年的年宣传费
x
i
和年销售量
y
i
(
i
=
1,2
,
…
,
8)
数据作了初步处理,得到下面的散点图及一些统计量的值
.
命题角度
2
非线性回归分析
解答
(1)
根据散点图判断,
y
=
a
+
bx
与
y
=
c
+
d
哪
一个适宜作为年销售量
y
关于年宣传费
x
的回归方程类型?
(
给出判断即可,不必说明理由
)
解
由散点图可以判断,
y
=
c
+
d
适宜
作为年销售量
y
关于年宣传费
x
的回归方程类型
.
(2)
根据
(1)
的判断结果及表中数据,建立
y
关于
x
的回归方程;
解答
(3)
已知这种产品的年利润
z
与
x
,
y
的关系为
z
=
0.2
y
-
x
.
根据
(2)
的结果回答下列问题:
①
年宣传费
x
=
49
时,年销售量及年利润的预报值是多少?
解答
②
年宣传费
x
为何值时,年利润的预报值最大?
附:对于一组数据
(
u
1
,
v
1
)
,
(
u
2
,
v
2
)
,
…
,
(
u
n
,
v
n
)
,其回归直线
v
=
α
+
βu
的斜率和截距的最小二乘估计分别为
解答
解
根据
(2)
的结果知,年利润
z
的预报值
故年宣传费为
46.24
千元时,年利润的预报值最大
.
反思与感悟
求非线性回归方程的步骤
(1)
确定变量,作出散点图
.
(2)
根据散点图,选择恰当的拟合函数
.
(3)
变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程
.
(4)
分析拟合效果:通过计算相关指数或画残差图来判断拟合效果
.
(5)
根据相应的变换,写出非线性回归方程
.
跟踪训练
3
在一次抽样调查中测得样本的
5
个样本点,数值如下表:
试建立
y
与
x
之间的回归方程
.
x
0.25
0.5
1
2
4
y
16
12
5
2
1
解答
解
由数值表可作散点图如图,
由置换后的数值表作散点图
如
右
:
根据散点图可知
y
与
x
近似地呈反比例函数关系,
t
4
2
1
0.5
0.25
y
16
12
5
2
1
由散点图可以看出
y
与
t
呈近似的线性相关关系,列表如下:
i
t
i
y
i
t
i
y
i
t
1
4
16
64
16
2
2
12
24
4
3
1
5
5
1
4
0.5
2
1
0.25
5
0.25
1
0.25
0.062 5
∑
7.75
36
94.25
21.312 5
达标检测
1.
下列两个变量之间的关系不是函数关系的是
A.
角度和它的余弦
值
B
.
正方形的边长和面积
C.
正
n
边形的边数和内角度数
和
D
.
人的年龄和身高
解析
函数关系就是变量之间的一种确定性关系
.
A
,
B
,
C
三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为
f
(
θ
)
=
cos
θ
,
g
(
a
)
=
a
2
,
h
(
n
)
=
(
n
-
2)π
.
D
选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选
D.
答案
解析
√
1
2
3
4
5
答案
解析
2.
设有一个线性回归
方程
=
2
-
1.5
x
,当变量
x
增加
1
个单位时
A.
y
平均增加
1.5
个
单位
B.
y
平均增加
2
个单位
C.
y
平均减少
1.5
个
单位
D.
y
平均减少
2
个单位
解析
由回归方程中两个变量之间的关系可以得到
.
1
2
3
4
5
√
答案
3.
如图四个散点图中,适合用线性回归模型拟合其中两个变量的是
1
2
3
4
5
A.
①②
B.
①③
C
.
②③
D
.
③④
√
解析
解析
由图易知
①③
两个图中样本点在一条直线附近,因此适合用线性回归模型
.
4.
某产品在某零售摊位的零售价
x
(
单位:元
)
与每天的销售量
y
(
单位:个
)
的统计资料如下表所示:
x
16
17
18
19
y
50
34
41
31
A.51
个
B.50
个
C.54
个
D.48
个
√
解析
1
2
3
4
5
答案
解答
5.
已知
x
,
y
之间的一组数据如下表:
1
2
3
4
5
x
0
1
2
3
y
1
3
5
7
x
1
y
1
+
x
2
y
2
+
x
3
y
3
+
x
4
y
4
=
0
×
1
+
1
×
3
+
2
×
5
+
3
×
7
=
34
,
解答
(2)
已知变量
x
与
y
线性相关,求出线性回归方程
.
1
2
3
4
5
回归分析的步骤:
(1)
确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)
画出确定好的解释变量和预报变量的散点图,观察它们之间的关系
(
如是否存在线性关系等
)
;
(3)
由经验确定回归方程的类型
(
如果呈线性关系,则选用线性回归
方程
)
;
(4)
按一定规则估算回归方程中的参数;
(5)
得出结果后分析残差图是否有异常
(
个别数据对应的残差过大,或残差呈现不随机的规律性等
)
,若存在异常,则检查数据是否有误或模型是否合适等
.
规律与方法