- 924.50 KB
- 2021-05-12 发布
第三节 用样本估计总体
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶
图,理解它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.
4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字
特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识点一 用样本的频率分布估计总体分布
1.通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率
分布,另一种是用样本的数字特征估计总体的数字特征.
2 . 在 频 率 分 布 直 方 图 中 , 纵 轴 表 示 ______ , 数 据 落 在 各 小 组 内 的 频 率 用
__________________表示,各小长方形的面积总和等于____.
3.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容
量的增加,作图时所分的______增加,组距减小,相应的频率分布折线图就会越来越接近于
一条光滑的曲线,统计中称之为____________,它能够更加精细的反映出总体在各个范围内
取值的百分比.
4.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且
可以随时记录,给数据的记录和表示都带来方便.
答案
2.频率
组距
各小长方形的面积 1
3.组数 总体密度曲线
1.判断正误
(1)在频率分布直方图中,小矩形的高表示频率.( )
(2)频率分布直方图中各个长方形的面积之和为 1.( )
答案:(1)× (2)√
2.(2016·山东卷)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图
所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),
[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这 200 名学生中每周的自习
时间不少于 22.5 小时的人数是( )
A.56 B.60
C.120 D.140
解析:由频率分布直方图可知,这 200 名学生每周的自习时间不少于 22.5 小时的频率为
(0.16+0.08+0.04)×2.5=0.7,故这 200 名学生中每周的自习时间不少于 22.5 小时的人数
为 200×0.7=140.故选 D.
答案:D
3.甲、乙两个班各随机选出 15 名同学进行测验,所得成绩的茎叶图如图.从图中看
________班的平均成绩较高.
解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.
答案:乙
知识点二 用样本的数字特征估计总体的数字特征
1.众数、中位数、平均数
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个
数据的平均数)叫做这组数据的中位数.
(3)平均数:样本数据的算术平均数,即 x =__________________.在频率分布直方图中,
中位数左边和右边的直方图的面积______.
2.样本方差、标准差
标准差 s=________________________________________.
其中 xn 是样本数据的第 n 项,n 是样本容量, x 是平均数.标准差是反映总体波动大小
的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体
容量时,样本方差很接近总体方差.
答案
1.(3)1
n
(x1+x2+…+xn) 相等
2. 1
n
[ x1- x 2+ x2- x 2+…+ xn- x 2]
4.某厂 10 名工人在一个小时内生产零件的个数分别是 15,17,14,10,15,17,17,16,14,12,
设该组数据的平均数为 a,中位数为 b,众数为 c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
解析:把该组数据按从小到大的顺序排列为 10,12,14,14,15,15,16,17,17,17,其平均数
a= 1
10
×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数 b=15+15
2
=15,众数
c=17,则 a0.5,
而前 4 组的频率之和为 0.04+0.08+0.15+0.21=0.48<0.5,
所以 2≤x<2.5.
由 0.50×(x-2)=0.5-0.48,解得 x=2.04.
故可估计居民月均用水量的中位数为 2.04 吨.
热点二 茎叶图及应用
【例 3】 (2017·福州模拟)某大学为调查来自南方和北方的大学生的身高差异,从 2013
级的年龄在 18—19 岁之间的大学生中随机抽取了来自南方和北方的大学生各 10 名,测量得
他们的身高(单位:cm)如下:
南方:158,170,166,169,180,175,171,176,162,163.
北方:183,173,169,163,179,171,157,175,178,166.
画出题中两组数据的茎叶图,并根据茎叶图对来自南方和北方的大学生的身高进行比较,
写出两个统计结论.
【解】 题中两组数据的茎叶图如图所示:
统计结论:①北方大学生的平均身高大于南方大学生的平均身高;②南方大学生的身高
比北方大学生的身高更整齐;③南方大学生的身高的中位数是 169.5,北方大学生的身高的中
位数是 172;④南方大学生的身高基本上是对称的,而且大多数集中在均值附近,北方大学生
的身高分布较分散.
【总结反思】
(1)茎叶图保留了全部的样本数据;(2)从茎叶图上可以发现样本数据的分散与集中程度,从
而对样本数据的平均值和方差作出定性判断.
(1)某中学从甲、乙两个艺术班中各选出 7 名学生参加市级才艺比赛,他们取得的成绩(满
分 100 分)的茎叶图如图所示,其中甲班学生成绩的众数是 85,乙班学生成绩的中位数是 83,
则 x+y 的值为( )
A.6 B.8 C.9 D.11
1 题图 2 题图
(2)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近 6 次数学测试的分数进行
统计,甲、乙两人的平均成绩分别是 x 甲、 x 乙,则下列说法正确的是( )
A. x 甲> x 乙,乙比甲成绩稳定,应选乙参加比赛
B. x 甲> x 乙,甲比乙成绩稳定,应选甲参加比赛
C. x 甲< x 乙,甲比乙成绩稳定,应选甲参加比赛
D. x 甲< x 乙,乙比甲成绩稳定,应选乙参加比赛
解析:(1)由茎叶图可知,茎为 8 时,甲班学生成绩对应数据只能是 80,80+x,85,因为
甲班学生成绩众数是 85,所以 85 出现的次数最多,可知 x=5.由茎叶图可知,乙班学生成绩
为 76,81,81,80+y,91,91,96,由乙班学生成绩的中位数是 83,可知 y=3.所以 x+y=8.故
选 B.
(2) 由 茎 叶 图 知 x 甲 = 72+78+79+85+86+92
6
= 82. x 乙 =
78+86+88+88+91+93
6
≈87.33.所以 x 甲< x 乙,又由乙的茎集中在 8,而甲较分散,即乙比
甲成绩稳定.故选 D.
答案:(1)B (2)D
热点三 样本的数字特征
【例 4】 (必修③P79 练习第 3 题改编)将甲、乙两个篮球队 10 场比赛的得分数据整理
成如图所示的茎叶图,由图可知( )
A.甲、乙两队得分的中位数相等
B.甲、乙两队得分的平均数相等
C.甲、乙两队得分的极差相等
D.甲、乙两队得分的方差相等
【解析】 由中位数定义知,甲的中位数为36+38
2
=37,乙的中位数为34+41
2
=37.5,
故选项 A 错误;由平均数定义得 x 甲= 1
10
(24+26+33+33+36+38+43+47+49+51)=38,
x 乙= 1
10
(22+25+32+33+34+41+44+45+51+53)=38,故选项 B 正确;由极差定义得,
甲的极差为 51-24=27,乙的极差为 53-22=31,故选项 C 错误;由方差定义知,s2
甲= 1
10
[(24
-38)2+(26-38)2+…+(51-38)2]=79,s2
乙= 1
10
[(22-38)2+(25-38)2+…+(53-38)2]=
99,故选项 D 错误.故选 B.
【答案】 B
【总结反思】
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重
要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(1)对于一组数据 xi(i=1,2,3,…,n),如果将它们改变为 xi+C(i=1,2,3,…,n),
其中 C≠0,则下列结论正确的是( )
A.平均数与方差均不变 B.平均数变,方差保持不变
C.平均数不变,方差变 D.平均数与方差均发生变化
(2)将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91,
现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:
则 7 个剩余分数的方差为( )
A.116
9
B.36
7
C.36 D.6 7
7
解析:(1)依题意,记原数据的平均数为 x ,方差为 s2,则新数据的平均数为
x1+C + x2+C +…+ xn+C
n
= x +C,即新数据的平均数改变;新数据的方差
为1
n
{[(x1+C)-( x +C)]2+[(x2+C)-( x +C)]2+…+[(xn+C)-( x +C)]2}=s2,即新数
据的方差不变.
(2)根据茎叶图,去掉 1 个最低分 87,1 个最高分 99,则1
7
[87+94+90+91+90+(90+x)
+91]=91,所以 x=4.所以 s2=1
7
[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2
+(94-91)2+(91-91)2]=36
7
.
答案:(1)B (2)B
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样
本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计
算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对
总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图
由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直
方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值 x1,x2,…,xn 的频率分别为 p1,p2,…,pn,则其平均值为 x1p1+x2p2+…+xnpn;
若 x1,x2,…,xn 的平均数为 x ,方差为 s2,则 ax1+b,ax2+b,…,axn+b 的平均数为 a x
+b,方差为 a2s2.
频率分布直方图易误点梳理
利用频率分布直方图估计总体的基本数字特征,简单地说,就是能“制图”,会“用图”,
而我们在应用中产生的错误也主要发生在这两个过程中.
错误一、制图——分组不对,频数统计错误
【例 1】 某校在开学之初,以班级为单位,对学生自行购买保险的情况进行了抽样统计,
得到了如下 20 个班级购买保险人数情况:
12,9,5,11,10,22,28,6,30,14,15,12,16,26,18,27,22,14,12,5
试作出该样本的一个频率分布直方图.
【错解】 这组数据的极差为 30-5=25,将组距定为 5,组数定为 5,则可将 20 个数据
分为[5,10], [10,15],[15,20],[20,25],[25,30]这 5 组, 得到每组 的频数分 别为
5,8,3,2,4.(剩余解答略)
【正解】 在上述解答中,各小组频数之和为 22,大于样本容量,显然是错误的.原因
是分组区间全是双闭区间,则数据“10”在第一组和第二组均被计入频数,数据“15”也是
如此.
在分组时,应将 20 个数据分为[5,10),[10,15),[15,20),[20,25),[25,30]这 5 组,
得到每组的频数分别为 4,7,3,2,4.(剩余解答略)
【易错总结】 分组时,每组所在区间一般是选择“左闭右开”,而不是“双闭”或“双
开”,防止某些数据漏选或被多次计入不同小组,从而导致频数统计失误.规避这种失误,
可以检查各组频数之和是否等于样本容量.
错误二、用图——将频率分布直方图的纵坐标“频率
组距
”误认为是“频率”
【例 2】 某校高一年级有 400 名学生,将他们的期中考试数学成绩(满分 100 分,成绩
均为不低于 40 分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图的频率分
布直方图.求该校高一年级期中考试数学成绩不低于 80 分的人数.
【错解】 根据频率分布直方图知,成绩不低于 80 分的频率为 0.025+0.01=0.035.∴
该校高一年级期中考试数学成绩不低于 80 分的人数为 400×0.035=14.
【正解】 根据频率分布直方图知,成绩不低于 80 分的频率为(0.025+0.01)×10=
0.35.∴该校高一年级期中考试数学成绩不低于 80 分的人数为 400×0.35=140.
【例 3】 对某校七年级 100 名学生每周的零用钱(单位:元)进行统计,得到频率分布直
方图如图所示,其中第 3 小组的频率为 0.34,第 1,2,4,5 小组的频率形成了公差为 0.03 的等
差数列,求图中 a 的值.
【错解】 由于各小组的频率之和为 1,且第 3 小组频率为 0.34,则第 1,2,4,5 小组频
率之和为 0.66.这 4 个小组的频率形成了公差为 0.03 的等差数列,设首项为 a1,则由等差数
列前 4 项之和为 0.66,可得 a1=0.12,则第 2 小组的频率为 0.15,故 a=0.15.
【正解】 第 2 小组频率的计算过程完全正确,第 2 小组的频率等于 0.15,但并不意味
着 a=0.15.因为第 2 小组的矩形的面积才是第 2 小组的频率,故矩形的高为0.15
5
=0.03,即
a=0.03.
【易错总结】 频率分布直方图中,关键要理解图中数据的意义,特别是图中每个小矩
形的面积才是这一组距内个体的频率.最高矩形的中点是众数,将直方图的面积一分为二的
垂直横轴的直线所对应的数值是中位数.
总之,我们要明确对频率分布直方图的绘制及结构认识.事实上频率分布直方图中的每
个小矩形的面积表示该组的频率,纵轴表示“频率
组距
”.