- 1.01 MB
- 2021-04-28 发布
专题 03 概率与统计
核心考点一古典概型
古典概型是高考考查热点,但一般不单独出现在解答题中,常与统计及其他知识结合在一起
考查,难度中等或中等以下.
【经典示例】(2017 山东卷文 16)某旅游爱好者计划从 3 个亚洲国家 , , 和 3 个欧洲
国家 , , 中选择 2 个国家去旅游.
(1)若从这 6 个国家中任选 2 个,求这 2 个国家都是亚洲国家的概率;
(2)若从亚洲国家和欧洲国家中各任选 1 个,求这 2 个国家包括 但不包括 的概率.
答题模板
第一步,判断试验是否为古典概型;
第二步,利用列举法或排列组合知识求出总的基本事件总数 与事件 包含的基本事件数
;
第三步,利用公式 ,求出事件 的概率.含有至多至少类型的概率问题,可考虑
其对立事件的概率,用 求解.
【满分答案】(1)由题意知,从 6 个国家中任选 2 个国家,其一切可能的结果组成的基本事件有:
共 15 个,
所选 2 个国家都是亚洲国家的事件所包含的基本事件有: ,共 3
个,
则所求事件的概率为 .
(2) 从亚洲国家和欧洲国家中各任选 1 个,其一切可能的结果组成的基本事件有:
,共 9 个,包括
1A 2A 3A
1B 2B 3B
1A 1B
n A
m
( ) mP A n
= A
( ) ( )1-P A P A=
( ) ( )1 2 1 3, , , ,A A A A ( )2 3, ,A A ( )1 1, ,A B ( ) ( )1 2 1 3, , , ,A B A B ( ) ( ) ( )2 1 2 2 2 3, , , , , ,A B A B A B
( ) ( ) ( )3 1 3 2 3 3, , , , , ,A B A B A B ( ) ( ) ( )1 2 1 3 2 3, , , , , ,B B B B B B
( ) ( ) ( )1 2 1 3 2 3, , , , ,A A A A A A
3 1
15 5P = =
( )1 1, ,A B
( ) ( )1 2 1 3, , , ,A B A B ( ) ( ) ( )2 1 2 2 2 3, , , , , ,A B A B A B ( ) ( ) ( )3 1 3 2 3 3, , , , ,A B A B A B 1A
但不包括 的事件所包含的基本事件有: 共 2 个.则所求事件的概率为
.
【解题技巧】1.利用古典概型求事件 A 的概率,关键是要分清基本事件总数 n 与事件 A 包含
的基本事件数 m.如果基本事件的个数比较少,可用列举法把古典概型试验所含的基本事件一
一列举出来,然后再求出事件 A 中的基本事件数,利用公式 P(A)=求出事件 A 的概率。对于古
典概型的概率计算问题,常见错误是基本事件数列举重复或遗漏,导致计数错误,避免此类错
误发生的最有效方法是按照某种标准进行列举,如果基本事件个数比较多,可借助于列表法或
树形图.
2.对于复杂概率的计算一般要先设出事件,准确地确定事件的性质,常见的处理方法有:
①转化为几个互斥事件的和,利用互斥事件的加法公式求解; ]
②采用间接法,先求事件 A 的对立事件 的概率,再由 P(A)=1-P( )求事件 A 的概率.
模拟训练
1.某园林基地培育了一种新观赏植物,经过一年的生长发育,技术人员从中抽取了部分植
株的高度(单位:厘米)作为样本(样本容量为 n)进行统计,按照[50,60),[60,70,)[70,80),
[80,90),[90,100]的分组作出频率分布直方图,并作出样本高度的茎叶图(图中仅列出了高
度在[50,60),[90,100]的数据).
(1)求样本容量 n 和频率分布直方图中的 x、y 的值;
(2)在选取的样本中,从高度在 80 厘米以上(含 80 厘米)的植株中随机抽取 2 株,求所抽
取的 2 株中至少有一株高度在[90,100]内的概率.
【解析】(1)由题意可知,样本容量 n= 8
0.016 × 10=50,y= 2
50 × 10=0.004,
x=0.100-0.004-0.010-0.016-0.040=0.030.
1B ( ) ( )1 2 1 3, , , ,A B A B
2
9P =
A A
其中 2 株的高度都不在[90,100]内的情况有 10 种,分别为:(a1,a2),(a1,a3),(a1,a4),
(a1,a5),(a2,a3),(a2,a4),(a2,a5),(a3,a4),(a3,a5),(a4,a5).
所以所抽取的 2 株中至少有一株高度在[90,100]内的概率 P=1-10
21=11
21.
核心考点二频率分布直方图与茎叶图
频率分布直方图及茎叶图一直是高考考查的热点,这类问题大多紧密结合社会实际,以现实
生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题
者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学
模型,再应用数学原理和数学工具解决实际问题.该类问题阅读量一般比较大,但难度多为中
等或中等偏易.
【经典示例】我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民
生活用水收费方案,拟确定一个合理的月用水量标准 (吨)、一位居民的月用水量不超过
的部分按平价收费,超出 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年
位居民每人的月均用水量(单位:吨),将数据按照 , , , 分成
组,制成了如图所示的频率分布直方图.
(1)求直方图中 的值;
(2)设该市有 万居民,估计全市居民中月均用水量不低于 吨的人数,请说明理由;
0.04
0.08
0.12
0.16
a
0.40
0.52
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量(吨)
频率
组距
x x
x
100 [ )0,0.5 [ )0.5,1 ⋅⋅⋅ [ )4,4.5 9
a
30 3
(3)若该市政府希望使 的居民每月的用水量不超过标准 (吨),估计 的值,并说明
理由.
答题模板
第一步,读懂题意,确定各组频率;.
第二步,利用概率之和为 1,求 的值;
第三步,用频率分别直方图估计平均数.
第四步,用样本数据对总体进行估计代换.
【满分答案】(1)由频率分布直方图知,月均用水量在 中的频率为 ,
同理,在 , , , , , 中的频率分别为 , , ,
, , .
由 ,解得 .
(2)由(1), 位居民每人月均用水量不低于 吨的频率为 .
由以上样本的频率分布,可以估计全市 万居民中月均用水量不低于 吨的人数为
.
(3)因为前 组的频率之和为 ,
而前 组的频率之和为 ,
所以 由 ,解得 .
【解题技巧】
1.解决频率分布直方图问题时要抓住:
(1)直方图中各小长方形的面积之和为 1.(2)直方图中纵轴表示
频率
组距,故每组样本的频率为组
距×
频率
组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.
2.频率分布直方图与众数、中位数与平均数的关系:
(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和
是相等的;(3)平均数等于频率分布直方图中每个小长方形的面积 乘以小长方形底边中点
85% x x
a
[ )0 0.5, 0.08 0.5 0.04× =
[ )0.5,1 [ )1.5,2 [ )2 2.5, [ )3 3.5, [ )3.5 4, [ )4 4.5, 0.08 0.20 0.26
0.06 0.04 0.02
0.04+0.08+0.5 0.20 0.26 0.5 0.06 0.04 0.02 1a a× + + + × + + + = 0.30a =
100 3 0.06+0.04+0.02=0.12
30 3
300000 0.12 36000× =
6 0.04 0.08 0.15 0.20 0.26 0.15=0.88 0.85− − − − − >
5 0.04+0.08+0.15 0.20 0.26=0.73 0.85− − <
2.5 3.x < ( )0.3 2.5 0.85 0.73x× − = − 2.9x =
iS
的横坐标 之和,即平均数= .
模拟训练
2.某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民.根据这 50 位市民对这
两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
【解析】(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位
的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.
50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为
66+68
2 =67,所以该市的市民对乙部门评分的中位数的估计值是 67.
核心考点三平均数与方差的应用
平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,
方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用
于方案取舍的重要的理论依据,
【经典示例】某公司计划购买 1 台机器,该种机器使用三年后即被淘汰.机器有一易损零件,
在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,如果备件
ix
1
n
i i
i
S x
=
∑
不足再购买,则每个 500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并
整理了 100 台这种机器在三年使用期内更换的易损零件数,得下面柱状图.
记 表示 台机器在三年使用期内需更换的易损零件数, 表示 台机器在购买易损零件
上所需的费用(单位:元), 表示购机的同时购买的易损零件数.
(1)若 ,求 与 的函数解析式;
(2)若要求 “需更换的易损零件数不大于 ”的频率不小于 ,求 的最小值;
(3)假设这 台机器在购机的同时每台都购买 个易损零件,或每台都购买 个易损
零件,分别计算这 台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购
买 台机器的同时应购买 个还是 个易损零件?
答题模板
第一步,用分段函数表示 与 的函数解析式;.
第二步,由柱状图确定更换易损零件数的频率;
第三步,根据购买易损零件上所需费用的平均数的大小进行选择.
【满分答案】(1)当 时, (元);
当 时, (元),
所以 .
(2)由柱状图可知更换易损零件数的频率如表所示.
更换的易损零件数 16 17 18 19 20 21
16 17 18 19 20 21
频数
更换的易损零件数0
6
10
16
20
24
x 1 y 1
n
19n = y x
n 0.5 n
100 19 20
100
1 19 20
y x
19x 19 200 3800y = × =
19x > ( )19 200 19 500 500 5700y x x= × + − × = −
3800, , 19
500 5700, , 19
x xy x x x
∈= − ∈ >
N
N
频率 0.06 0.16 0.24 0.24 0.20 0.10
所以更换易损零件数不大于 18 的频率为: ,
更换易损零件数不大于 19 的频率为: ,故 最小值
为 .
(3)若每台都购买 个易损零件,则这 台机器在购买易损零件上所需费用的平均数为:
(元);
若每台都够买 个易损零件,则这 台机器在购买易损零件上所需费用的平均数为:
(元).
因为 ,所以购买 台机器的同时应购买 个易损零件.
【解题技巧】
1.利用平均数与方差进行决策,一般先比较平均数,若平均数相同,再用方差来决定.
2.平均数、方差公式的推广:若数据 x1,x2,…,xn 的平均数为 x
-
,方差为 s2,则数据 mx1+
a,mx2+a,…,mxn+a 的平均数为 m x
-
+a,方差为 m2s2.
模拟训练
3.某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据
用户对产品的满意度评分,得出 A 地区用户满意评分的频率分布直方图和 B 地区用户满
意度评分的频数分布表.
B 地区用户满意度评分的频数分布表
A地区用户满意度评分的频率分布直方图
满意度评分
频率/组距
100908070605040
0.040
0.035
0.030
0.025
0.020
0.015
0.010
0.005
0.06 0.16 0.24 0.46 0.5+ + = <
0.06 0.16 0.24 0.24 0.70 0.5+ + + = > n
19
19 100
100 19 200 20 500 2 10 500 4000100
× × + × + × × =
20 100
100 20 200 10 500 4050100
× × + × =
4000 4050< 1 19
满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100)
频数 2 8 14 10 6
(1)在答题卡上作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地
区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分 低于 70 分 70 分到 89 分 不低于 90 分
满意度等级 不满意 满意 非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
【解析】(1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意
度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集
中,而 A 地区用户满意度评分比较分散.
核心考点四回归分析
高考对回归分析的考查方向比较固定,即先根据数据确定回归方程,再根据散点图或相关系
0.005
0.010
0.015
0.020
0.025
0.030
0.035
0.040
50 60 70 80 90 100
频率/组距
满意度评分
B地区用户满意度评分的频率分布直方图
数判断相关性的强弱,最后根据回归方程进行预测,此类问题运算量一般较大,要注意运算
的准确性.
【经典示例】下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图
(1)由折线图看出,可用线性回归模型拟合 与 的关系,请用相关系数加以说明
(2)建立 关于 的回归方程(系数精确到 ),预测 年我国生活垃圾无害化处
理量.
参考数据: , , , .
参考公式:相关系数
回归方程 中斜率和截距的最小二乘估计公式分别为:
答题模板
第一步,利用散点图或相关系数 r,确定两个变量的相关程度的高低;
第二步,用最小二乘法求回归直线方程 = x+ ;
第三步,利用回归直线方程进行预报;
第四步,对于非线性(可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目
y
年
生
活
垃
圾
无
害
化
处
理
量
年份代码t
7652 3 41
1.40
1.80
1.60
1.20
1.00
0.80
y t
y t 0.01 2016
7
1
9.32i
i
y
=
=∑ 7
1
40.17i i
i
t y
=
=∑ 7
2
1
( ) 0.55i
i
y y
=
− =∑ 7 2.646≈
1
2 2
1 1
( )( )
( ) (y y)
n
i i
i
n n
i i
i i
t t y y
r
t t
=
= =
− −
=
− −
∑
∑ ∑
,
y a bt= + 1
2
1
( )( )
( )
n
i i
i
n
i
i
t t y y
b
t t
=
=
− −
=
−
∑
∑
,
= .a y bt−
yˆ bˆ aˆ
中的非线性关系转化为线性关系进行分析,最后还原.
【 满 分 答 案 】( 1 ) 由 折 线 图 中 数 据 和 附 注 中 参 考 数 据 得 , ,
,[来源:学,科,网]
,
.
因为 与 的相关系数近似为 ,说明 与 的线性相关程度相当高,从而可以用线性回
归模型拟合 与 的关系.
(1)变量 与 的相关系数
,
又 , , , ,
,
所以 ,故可用线性回归模型拟合变量 与 的关系.
(2) , ,所以 ,
,所以线性回归方程为 .
当 时, .因此,我们可以预测 2016 年我国生活垃圾无害化处理
亿吨.学科.网
【解题技巧】线性回归分析问题的类型
(1)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
4t = ( )27
1
28i
i
t t
=
− =∑
( )27
1
0.55i
i
y y
=
− =∑
( )( )7 7 7
1 1 1
40.17 4 9.32 2.89i i i i i
i i i
t t y y t y t y
= = =
− − = − = − × =∑ ∑ ∑ 2.89 0.990.55 2 2.646r ≈ ≈× ×
y t 0.99 y t
y t
y t
7 7 7 7
1 1 1 1
7 7 7 7
2 2 2 2
1 1 1 1
( )( ) 7
( ) ( ) 7 ( ) ( )
i i i i i i
i i i i
i i i i
i i i i
t t y y t y t y
r
t t y y t t y y
= = = =
= = = =
− − − ⋅
= =
− ⋅ − × − ⋅ −
∑ ∑ ∑ ∑
∑ ∑ ∑ ∑
7
1
28i
i
t
=
=∑ 7
1
9.32i
i
y
=
=∑ 7
1
40.17i i
i
t y
=
=∑ 7
2
1
( ) 2 7 5.292i
i
t t
=
− = =∑
7
2
1
( ) 0.55i
i
y y
=
− =∑
7 40.17 28 9.32 0.997 5.292 0.55r
× − ×= ≈× × y t
4t = y =
7
1
1
7 i
i
y
=
∑
7
1
7
2 2
1
17 40.17 7 4 9.327ˆ 0.10287
i i
i
i
i
t y t y
b
t t
=
=
− ⋅ − × × ×
= = =
−
∑
∑
1ˆˆ 9.32 0.10 4 0.937a y bx= − = × − × ≈ ˆ 0.1 0.93y t= +
9t = ˆ 0.1 9 0.93 1.83y = × + =
1.83
(2)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b
^
.
(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的线性相关性
越强.
模拟训练
4.某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间 (x 个
月)和市场占有率(y%)的几组相关对应数据:
x 1 2 3 4 5
y 0.02[来源: ] 0.05 0.1 0.15 0.18
(1)根据上表中的数据,用最小二乘法求出 y 关于 x 的线性回归方程;
(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经
过 多 少 个 月 , 该 款 旗 舰 机 型 市 场 占 有 率 能 超 过 0.5%( 精 确 到 月 ) . 附 : b^
=
∑n
i=1
x iyi-n x
-
· y
-
∑n
i=1
x 2i-n x
-
2
,a^
= y
-
-b^
x
-
.
所以线性回归方程为y^
=0.042x-0.026.
(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加 1 个月,
市场占有率约增加 0.042 个百分点.由y^
=0.042x-0.026>0.5,解得 x≥13,[来源:学&科&网]
故预计上市 13 个月时,该款旗舰机型市场占有率能超过 0.5%.
核心考点五独立性检验
在高考中独立性检验常与抽样方法、样本对总体的估计等知识结合在一起考查,难度多为中
等或中等以下,属于得分题.
【经典示例】某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工人 200 名.为研
究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了 100 名工人,先
统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁
以 下 ” 分 为 两 组 , 再 将 两 组 工 人 的 日 平 均 生 产 件 数 分 成 5 组 :
[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图
(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周岁以下
组”工人的概率;
(2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列联表,并
判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”?
附:K2=
P(K2≥k) 0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
答题模板
第一步,假设两个分类变量 x 与 y 没有关系;
第二步,计算出 K2 的观测值,其中 K2=;
第三步,把 K2 的值与临界值比较,作出合理的判断.
【满分答案】(1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名,所以,
样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),25 周岁以
下组工人有 40×0.05=2(人),从 5 名工人中随机抽取 2 人有 C 25=10 种情形,每种情形都是等
可能出现的,其中至少抽到一名“25 周岁以下组”工人有 C13C12+C22=7 种,故所求概率 P=.
(2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”中的生产能手有 60×0.25
=15(人),“25 周岁以下组”中的生产能手有 40×0.375=15(人),据此可得 2×2 列联表如图所示:
生产能手 非生产能手 合计
25 周岁以上组 15 45 60
25 周岁以下组 15 25 40
合计 30 70 100
所以 K2===≈1.79.
因为 1.79<2.706,所以没有 90%的把握认为“生产能手与工人所在的年龄组有关” .
【解题技巧】
(1)在列联表中注意事件的对应及相关值的确定,不可混淆.
(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出
错.
(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判
断,而非其他.
模拟训练
5.某公司为评估两套促销活动方案(方案 1 运作费用为 5 元/件;方案 2 的运作费用为 2 元/
件),在某地区部分营销网点进行试点(每个试点网点只采用一种促销活动方案),运作一
年后,对比该地区上一年度的销售情况,制作相应的等高条形图如图所示.
(1)请根据等高条形图提供的信息,为该公司今年选择一套较为有利的促销活动方案(不
必说明理由);
(2)已知该公司产品的成本为 10 元/件(未包括促销活动运作费用),为制定本年度该地
区的产品销售价格,统计上一年度的 8 组售价 (单位:元/件,整数)和销量 (单位:
件)( )如下表所示:
售价 33 35 37 39 41 43 45 47
销量 840 800 740 695 640 580 525 460
① 请根据下列数据计算相应的相关指数 ,并根据计算结果,选择合适的回归模型进行拟
ix iy
1,2, ,8i =
x
y
2R
合;
② 根据所选回归模型,分析售价 定为多少时?利润 可以达到最大.
49428.74
11512.
43
175.26
124650
(附:相关指数 )
因为 ,所以采用回归模型 进行拟合最为合适.
②由(1)可知,采用方案 1 的运作效果较方案 2 好,
故年利润 , ,
当 时, 单调递增;
当 时, 单调递减,故当售价 时,利润达
到最大.
x z
1200l 50 0ˆ n 0y x= − + 27 1700ˆy x= − + 21 1 003
ˆ 2y x= − +
( )8 2
1
ˆi i
i
y y
=
−∑
( )8 2
1
i
i
y y
=
−∑
( )
( )
2
2 1
2
1
ˆ
1
n
i ii
n
ii
y y
R
y y
=
=
−
= −
−
∑
∑
2 2 2
3 2 1R R R> > 21 1 003
ˆ 2y x= − +
( )21 1200 153z x x = − + −
( )( )30 40z x x′ = − + −
( )0,40x∈ ( )21 1200 153z x x = − + −
( )40,x∈ +∞ ( )21 1200 153z x x = − + − 40x =