- 713.22 KB
- 2021-04-23 发布
统计、统计案例
统计与统计案例是高中数学的重要学习内容,它是一种处理问题的方法,在工农业生产
和社会生活中有着广泛的应用,渗透到社会的方方面面,统计的基础知识成为每个公民的必
备常识. 由于中学数学中所学习统计与统计案例内容是基础的,高考对这一部分内容的考查
注重考查基础知识和基本方法.该部分在高考试卷中,一般是 2—3 个小题或一个解答题,难
度值在 0.5~0.8.
考试要求:统计:(1)随机抽样:① 理解随机抽样的必要性和重要性.② 会用简单随
机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.(2):用样本估计总体① 了
解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解
它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差.③ 能从样本数
据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.④ 会用样本的频率分
布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体
的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.(3)
变量的相关性:① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关
系.② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
统计案例:了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)
独立性检验了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用.(2)回
归分析:了解回归的基本思想、方法及其简单应用.
题型一 抽样方法
例 1(1)某高校甲、乙、丙、丁四个专业分别有 150、150、400、300 名学生,为了解学生
的就业倾向,用分层抽样的方法从该校这四个专业共抽取 40 名学生进行调查,应在丙专
业抽取的学生人数为 .
(2)利用简单随机抽样的方法,从 n 个个体(n>13)中抽取 13 个个体,依次抽取,若第
二次抽取后,余下的每个个体被抽取的概率为
36
1 ,则在整个抽样过程中,每个个体被抽取的
概率为
点拨: (1)在分层抽样中应注意总体中各个层次人数的比例,在样本中应保持比例不变(2)
简单随机抽样过程中,每一次的抽取,剩下的个体被抽到的概率都是一样的,所以应先求 n.
解:( 1)总体甲:乙:丙:丁=3:3:8:6,所以样本中丙专业抽取的学生人数=
840 163 3 8 6=+++
(1)由题意得:
36
1
2
11 n
解得 398n ,
∴在整个抽样过程中,每个个体被抽取的概率为
398
13 .
易错点:(1) 把样本中的各层次的比例算错.(2)误认为在简单随机抽样的每一次抽取中
个体被抽到的概率不同导致错误.
变式与引申 1:某公司生产三种型号的轿车,产量分别为 1200 辆,6000 辆和 2000 辆.为检验
该公司的产品质量,现用分层抽样的方法抽取 46 辆进行检验,这三种型号的轿车依次应抽取
____,
____, ____辆.
变式与引申 2:经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,
其中执“一般”态度的比“不喜欢”态度的多 12 人,按分层抽样方法从全班选出部分学生座
谈摄影,如果选出的 5 位“喜欢”摄影的同学、1 位“不喜欢”摄影的同学和 3 位执“一般”
态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人.
题型二 统计图表问题
例 2 从一条生产线上每隔 30 分钟取一件产品,共取了 n 件,测得其产品尺寸后,画得其
频率直方图如下.尺寸在[15,45)内的频数为 46.
(1)求 n 的值;
(2)求尺寸在[20,25)内产品的个数.
点拨:用样本频率分布去估计总体分布.
解:(1)由题意得,尺寸在[10,15)内的 概率
是 5×0.016=0.08.所以尺寸在[15,45)内的概率
为 1-0.08=0.92.由
n
46 =0.92,∴n=50.
(2)尺寸在[20,25)内的概率是 0.04×5=0.2. 故在该
区间内产品的个数是 50×0.2=10(个)
易错点:在直方图中频率每一个长方形的面积,而不
是其高度.
变式与引申 3: ⑴有一个容量为 100 的样本,数据的分组及各组的频数如下:
[12.5,15.5], 6;[ 15.5,18.5], 16;[ 18.5,21.5], 18;[ 21.5,24.5], 22;
[24.5,27.5), 20;[ 27.5,30.5), 10;[ 30.5,33.5), 8.
①列出样本的频率分布表;②画出频率分布直方图;③估计数据小于 30.5 的概率
题型三 平均数、标准差(方差)的计算问题
例 3 一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9. 9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016 C.9.5,0.04 D.9.5,0.016
点拨:本题考查平均数与方差的计算公式;
解: 5.95
7.96.934.9 x ,
016.0])5.97.9()5.96.9(3)5.94.9[(5
1 2222 s 答案:D
易错点:没理解记忆,公式记错.
变式与引申 4: x 是 1 2 100,,x x x 的平均数,a 是 1 2 40,,x x x 的平均数,b 是 41 42 100,,x x x
的平均数,则 x , , 之间的关系为 .
变式与引申 5:某人 5 次上班途中所花时间(单位:分钟)分别为 x 、 y 、10、11、9.已
知这组数据的平均数为 10,方差为 2,则 yx 的值为( )
A.1 B.2 C.3 D.4
题型四 线性回归分析
例 4 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产
能耗 y (吨标准煤)的几组对照数据:
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性
回归方程 y bx a;
(3)已知该厂技术改造前100吨甲产品能耗为90 吨标准煤;试根据(2)求出的线性回归方
程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
点拨:本题中散点图好作,本题的关键是求 y 关于 x 的线性回归方程 ,它既可以由
给出的回归系数公式直接计算,也可以遵循着最小二乘法的基本思想――即所求的直线应使残
差平方和最小,用求二元函数最值的方法解决.
解:( 1)散点图如图 422;
(2)方法一:设线性回归方程为 y bx a,则
2 2 2 2
2 2 2 2 2
( , ) (3 2.5) (4 3) (5 4) (6 4.5)
4 2 (18 14) (3 2.5) (4 3) (5 4) (6 4.5)
f a b b a b a b a b a
a a b b b a b
∴ 79 3.5 4.52
bab 时, ( , )f a b 取得最小值,
2 2 2 2(1.5 1) (0.5 0.5) (0.5 0.5) (1.5 1)b b b b , 即
2 2 2 50.5[(3 2) ( 1) ] 5 7 2b b b b ,∴ 0.7, 0.35ba时,
,f a b 取得最小值.所以线性回归方程为 0.7 0.35yx.
方法二:由系数公式可知, 2
66.5 4 4.5 3.5 66.5 634.5, 3.5, 0.7586 4 4.5
x y b
93.5 0.7 0.352a ,所以线性回归方程为 .
(3) 100x 时, 0.7 0.35 70.35yx ,所以预测生产100 吨甲产品的生产能耗比技术改造
前降低19.65吨标准煤.
易错点:本题容易用错计算回归系数的公式,或是把回归系数和回归常数弄颠倒了.
变式与引申 6: 为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现
对他前7 次考试的数学成绩 x 、物理成绩 y 进行分析.下面是该生7 次考试的成绩.
数学
8
8
8
8
8
3
11
17
9
9
2
11
08
11
00
11
12
物理
9
9
4
9
9
1
11
08
9
9
6
11
04
11
01
11
06
x 3 4 5 6
y 2.5 3 4 4.5
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该生的物理成绩 y 与数学成绩 x 是线性相关的,若该生的物理成绩达到115 分,请
你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学
习数学、物理上的合理建议.
本节主要考查:(1)三种抽样方法;总体分布的估计;线性回归等.(2)解答概率统计试
题时要注意分类与整合、化归与转化思想的运用.
点评:( 1)简单随机抽样方法应注意抽样的公平性,分层抽样应注意每个层次个体的比值;(2)
用样本频率分布去估计总体分布;用样本的某种数学特征去估计总体相应数学特征.解题途
径:应用所掌握的基础知识进行计算.(3)进行总体平均数的估计与总体方差的估计. 解题
途径:利用样本的平均数与方差分别作为总体的期望值和方差的估计.(4)线性回归分析.解
题途径:先作出散点图,再根据公式确定回归方程中的参数 ba, ,并可以根据求出的方程做预
测或给出建议.
习题 4-2
1. 某公司甲、乙、丙、丁四个地区分别有 150 个、120 个、180 个、150 个销售点.公司为
了调查产品销售的情况,需从这 600 个销售点中抽取一个容量为 100 的样本,记这项调查为
①;在丙地区中有 20 个特大型销售点,要从中抽取 7 个调查其收入和售后服务等情况,记这
项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
2.某校有老师 200 人,男学生 1200 人,女学生 1000 人.现用分层抽样的方法从所有师生中抽
取一个容量为 n 的样本;已知从女学生中抽取的人数为 80 人,则 = .
3. 某工厂对一批产品进行了抽样检测.右图 4-2-3 是根据抽样检测后的
产品净重(单位:克)数据绘制的频率分布直方图,其中产品
净重的范围是[96,106],样本数据分组为[96,98), [98,100),
[100,102),[102,104),[104,106],已知样本中产品净重小于
100 克的个数是 36,则样本中净重大于或等于 98 克并且
小于 104 克的产品的个数是 .
4.(2011 年高考北京卷。文)以下茎叶图记录了甲、乙两组各四名同学的植树棵树.乙组记录
中有一个数据模糊,无法确认,在图中以 X 表示.
(1)如果 X=8,求乙组同学植树棵树的平均数和方差;
(2)如果 X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为
96 98 100 102 104 106
0.150
0.125
0.100
0.075
0.050
克
频率/组距
图 4-2-3
19 的概率.
(注:方差 ],)()()[(1 22
2
2
1
2 xxxxxxns n 其中 x 为 nxxx ,,, 21 的平均
数)
5. 假设关于某设备使用年限 x(年)和所支出的维修费用 y(万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
若由资料知,y 对 x 呈线性相关关系,试求:
(1)回归直线方程;
(2)估计使用年限为 10 年时,维修费用约是多少?
【答案】
变式与引申 1:解:⑴三种型号的汽车数量比为 3:15:5,所以样本中三种汽车数量为 6,30,10.
变式与引申 2:解:“喜欢”:“一般”:“不喜欢”=5:3:1,
∴令全班总人数为 n ,则 12)9
1
9
3( n ,解得 54n
∴“喜欢”的人数= 30549
5 人,比 27 多 3 人.
答案:3
变式与引申 3:
⑴①解:⑴样本的频率分布表如下:
分 组 频 数 频 率
12.5~15.5 6 0.06
15.5~18.5 16 0.16
18.5~21.5 18 0.18
21.5~24.5 22 0.22
24.5~27.5 20 0.20
27.5~30.5 10 0.10
30.5~33.5 8 0.08
合 计 100 1.00
②频率分布直方图如图.
③数据小于 30.5 的概率约为 0.92.
变式与引申 4:⑴ 40 60
100
abx ;
变式与引申 5:解:由题意得:
8)10()10(
20
22 yx
yx
,∴ 1922,20822 xyyx ,
∴ 161922082222 xyyxyx ,∴ 4 yx 选 D
变式与引申 6:
分析:成绩的稳定性用样本数据的方差判断,由物理成绩估计数学成绩由回归直线方程解决.
解:( 1) 12 17 17 8 8 12100 1007x ;
6 9 8 4 4 1 6100 1007y ;
2 994= =1427S 数学 , 2 250= 7S 物理 ,
从而 22SS数学 物理 ,所以物理成绩更稳定.
(2)由于 x 与 y 之间具有线性相关关系,根据回归系数公式得到
497ˆ ˆ0.5, 100 0.5 100 50994ba ,
线性回归方程为 0.5 50yx.当 115y 时, 130x .
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步 提
高.
习题 4-2
1.B 冲根据抽样的特点进行选择不同的抽样方法
2.解: 192801000
2400 n
3. 90
解:产品净重小于 100 克的概率为(0.050+0.100)×2=0.300,
已知样本中产品净重小于 100 克的个数是 36,设样本容量为 n ,
高
考
则 300.036 n
,所以 120n ,净重大于或等于 98 克并且小于
104 克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本
中净重大于或等于 98 克并且小于 104 克的产品的个数是
120×0.75=90.
4.解:(1)当 X=8 时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,
所以平均数为
;4
35
4
10988 x
方差为
.16
11])4
3510()4
359()4
358[(4
1 2222 s
(Ⅱ)记甲组四名同学为 A1,A2,A3,A4,他们植树的棵数依次为 9,9,11,11;
乙组四名同学为 B1,B2,B3,B4,他们植树的棵数依次为 9,8,9,10,分别从甲、
乙两组中随机选取一名同学,所有可能的结果有 16 个,它们是:
(A1,B1),(A1,B2),(A1,B3),( A1,B4),
(A2,B1),(A2,B2),(A2,B3),( A2,B4),
(A3,B1),(A2,B2),(A3,B3),( A1,B4),
(A4,B1),(A4,B2),(A4,B3),( A4,B4),
用 C 表示:“选出的两名同学的植树总棵数为 19”这一事件,则 C 中的结果有 4 个,它们
是:(A1,B4),( A2,B4),(A3,B2),(A4,B2),故所求概率为 .4
1
16
4)( CP
5. 解: (1)依题列表如下:
i 1 2 3 4 5
ix 2 3 4 5 6
iy 2.2 3.8 5.5 6.5 7.0
iixy 4.4 11.4 22.0 32.5 42.0
45xy,
55
2
11
90 112.3i i i
ii
x x y
,
……4 分