- 1.10 MB
- 2021-04-17 发布
2017届高考数学考点总动员【二轮精品】第一篇
热点20 统计
【热点考法】本热点考题形式为选择填空题或解答题,以实际问题为背景、与概率、框图等结合主要考查抽样方法、样本频率分布估计总体频率分布、样本数字特征估计总体数字特征、回归分析、独立性检验等统计知识与方法,考查应用意识、阅读理解能力、数据处理能力、运算求解能力,难度为基础题或中档题,分值为5至17分.
【热点考向】
考向一 抽样方法
【解决法宝】 解决抽样问题的策略
1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量较多且差别不大时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.
2.系统抽样:
(1)若从容量为N的总体中抽取容量为n的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔k,以便对总体进行分段.
(2)当是整数时,取k=作为分段间隔即可,当不是整数时,应先从总体中随机剔除一些个体,使剩余个体数N′能被n整除,这时分段间隔k=.
(3) 利用简单随机抽样确定在第一组中抽取的个体的号码数,譬如第一组号码为,则第n组号码为.
3.分层抽样:若总体有差异的几部分组成,用分层抽样方法,按同比例比例抽样.
例1【四川省遂宁市2017届高三上学期期末】某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.9 B.10 C.12 D.13
【分析】甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,求出丙车间生产产品所占的比例,从而求出n的值.
【解析】因为甲、乙、丙三个车间生产的产品件数分别为120,80,60,
所以甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,
所以丙车间生产产品所占的比例为,
因为样本中丙车间生产产品有3件,占总产品的,
∴样本容量,故选D.
例2【安徽“皖南八校”2017届高三第二次联考,3】某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为( )
A.16 B.17 C.18 D.19
【分析】利用系统抽样方法即可确定第一组的号码.
【解析】第一组用简单随机抽样抽取的号码为,选C
考向二 总体估计
【解决法宝】1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
4.茎叶图图中的中位数:数据从小到大排成一排,中间为一个数或两个数的平均值.
5.样本数据的算术平均数,即=.
6.标准差的平方就是方差,方差的计算
基本公式
例3【湖南五市十校教研教改共同体2017届高三上学期12月联考,4】某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则的值是( ).
A.5 B.6 C.7 D.8
【分析】由平均值公式即可求出m,由中位数即可求出n,即可求出|n-m|的值.
【解析】甲组学生成绩的平均数是,乙组学生成绩的中位数是89,所以,选B.
例4【重庆巴蜀中学2017届高三上学期期中,18】(本小题满分12分)重庆市某厂党支部10月份开展“两学一做”活动,将10名党员技工平均分为甲,乙两组进行技能比赛.要求在单位时间内每个技工加工零件若干,其中合格零件的个数如下表:
1号
2号
3号
4号
5号
甲组
4
5
7
9
10
乙组
5
6
7
8
9
(1)分别求出甲,乙两组技工在单位时间内完成合格零件的平均数及方差,并由此分析两组技工的技术水平;
(2)质检部门从该车间甲,乙两组中各随机抽取1名技工,对其加工的零件进行检测,若两人完成合格零件个数之和超过12件,则称该车间“质量合格”,求该车间“质量合格”的概率.
【分析】(1)根据给出的数据进行计算即可,方差大的差异大;(2)用列举法分别列了两组里各有5人,从两组里分别抽1人及其中质量合格的所有事件,然后用古典概型概率公式可得结论.
【解析】(1)依题中的数据可得:,
∵,
∴两组技工的总体水平相同,甲组中技工的技术水平差异比乙组大;
考向三 回归分析
【解决法宝】1.散点图:表示具有相关关系的两个变量的一组数据的图形叫散点图.
2.①正相关:如果散点图中的点分布在从左下到右上的区域内,称为正相关.
②负相关:若散点图中的点分布在从左上角到右下角的区域内,称为负相关.
3.求回归直线方程的关键
(1)正确理解和合理选择回归方程系数的计算公式并能准确地进行运算,若样本数据较小,选第二个公式,若样本数据较大但与样本均值差较小用第1个公式.
(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
(3)计算线性回归方程公式:,其中.
4.回归直线一定过样本中心点(,).
例5【广西陆川县中学2017届高三上学期12月考,17】(本小题满分12分)假设某商品的销售量(件)与利润(万元)有如下统计数据:
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
且已知.
(1)对进行线性相关性检验;
(2)如果与具有线性相关关系,求出回归直线方程,并估计销售量为10
件时,利润约是多少?
附相关公式:,,
【分析】(1)直接套用附加相关系数的公式计算,即可得与之间的相关关系;(2)运用公式求得回归直线方程,将 代入所求回归直线方程中,即可估计利润.
【解析】(1),
相关系数的分子为
,,
所以.
因为,所以与之间具有很强的线性相关关系.
(2)因为
所以所求的回归直线方程为
当时,,即估计销售量为 件时,利润约为 万元.
考向四 独立性检验
【解决法宝】独立性检验的基本方法
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表如表:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
①根据实际问题需要的可信度确定临界值;
②利用公式=,由观测数据计算得到随机变量的观测值;
③如果>,就以的把握认为“与有关系”;否则就说样本观测值没有提供“与有关系”的充分证据.
例6【广西南宁二中、柳州高中、玉林高中2017届高三8月联考,7】某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为( )
A.90% B.95% C.99% D.99.9%
附:参考公式和临界值表
0.050
0.010
0.001
3.841
6.635
10.828
【分析】根据实际问题需要的可信度确定临界值,由观测数据计算得到随机变量的观测值,即可作出判定.
【解析】由题意,得,所以有的把握认为其亲属的饮食习惯与年龄有关,故选C.
【热点集训】
1.【黑龙江省哈尔滨六中2016届高三上学期期末】
某校高中研究性学习小组对本地区2005年至2007年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭( )
A.82万盒 B.83万盒 C.84万盒 D.85万盒
【答案】
【解析】该地区三年销售盒饭总数为30×1+45×2+90×1.5=255,
∴该地区每年平均销售盒饭255÷3=85(万盒),故选D.
2. 【山东省实验中学2017届高三第一次诊,4】高三学生体检,某班级随机抽取5名女学生的身高(厘米)和体重(公斤)的数据如下表:
165
160
175
155
170
58
52
62
43
60
根据上表可得回归直线方程为,则( )
A. B. C. D.
【答案】A
【解析】回归直线方程过点,而,所以,选A.
3.【江西南昌市2017届上学期摸底,5】一次选拔运动员,测得7名选手的身高(单位:)分布茎叶图如图,测得平均身高为177,有一名候选人的身高记录不清楚,其末位数记为,那么的值为( )
A.5 B.6 C.7 D.8
【答案】D
【解析】,解得,选D.
4.【山东肥城市2017届高三上学期升级统测,3】如图是某居民小区年龄在岁到岁的居民上网情况的频率分布直方图,现已知年龄在的上网人数呈现递减的等差数列, 则年龄在的频率是( )
A. B. C. D.
【答案】C
【解析】的概率和为,又的概率依次成等差数列,所以的频率为选C.
5.【株洲市2017届高三年级教学质量统一检测(一)】已知样本数据的平均数是5,标准差是,
则( )
A. B. C. D.
【答案】A
6.【河北省唐山一中2017届高三上学期12月调研考试】右图是一容量为
的样本的重量的频率分布直方图,则由图可估计样本的重量的中位数为( )
A.11 B.11.5 C.12 D.12.5
【答案】C
【解析】设中位数为., ,解得.故C正确.
7.【广西南宁二中、柳州高中、玉林高中2017届高三8月联考,7】某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为( )
A.90% B.95% C.99% D.99.9%
附:参考公式和临界值表
0.050
0.010
0. 001
3.841
6.635
10.828
【答案】C
【解析】由题意,得,所以有的把握认为其亲属的饮食习惯与年龄有关,故选C.
8.【广东珠海市2017届上学期调研测试(1),4】已知甲、乙两组数据如图茎叶图所示,若它们的中位数相同,平均数也相同,则图中的的比值( )
A. B. C. D.1
【答案】A
【解析】因为乙的中位数是,所以,可求得甲的平均数是,因此乙的平均数也是,进而得,,故选A.
9.【湖南永州市2017届高三第一次模拟,3】某学校高一、高二、高三年级的学生人数之比为4:3:3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为( )
A.15 B.20 C.25 D.30
【答案】A
【解析】由分层抽样得,从高二年级抽取的学生人数为人.
10.【云南省、四川省、贵州省2017届高三上学期百校大联考数学,4】从某项综合能力测试中抽取100人的成绩,统计如下,则这100个成绩的平均数为( )
A.3 B.2.5 C.3.5 D.2.75
【答案】A
【解析】设这100个成绩的平均数即为,则.
11.【广东佛山2017届高三教学质量检测(一),5】本学期王老师任教两个平行班高三A班,高三B班,两个班都是50个学生,如图反映的是两个班在本学期5次数学测试中的班级平均分对比:根据图表,不正确的结论是( )
A.A班的数学成绩平均水平好于B班 B.B班的数学成绩没有A班稳定;
C.下次考试B班的数学平均分数高于A班 D.在第1次考试中,A,B两个班的总平均分为98.
【答案】C
【解析】由图知,A、B、D正确,此图不能预测出下次两个班的平均成绩,故C不正确,故选C.
12. 【贵州遵义2017届高三上学期期中联考,3】某校高三年级有1000名学生,随机编号为0001,0002,...,1000,现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是( )
A.0927 B.0834 C.0726 D.0116
【答案】A
【解析】系统抽样就是等距抽样,编号满足,因为,所以选A.
13.【北京市西城区2016届高三第一学期期末】某校某年级有100名学生,已知这些学生完成家庭作业的时间均在区间内(单位:小时),现将这100人完成家庭作业的时间分为3组:,,加以统计,得到如图所示的频率分布直方图.在这100人中,采用分层抽样的方法抽取10名学生研究其视力状况与完成作业时间的相关性,则在抽取样本中,完成作业的时间小于2.5个小时的有_____人.
【答案】9
【解析】
14.【江西南昌市2017届上学期摸底,16】对某文科班50名同学的一次数学成绩进行了统计,全年级文科数学平均分是100分,这个班数学成绩的频率分布直方图如图:(总分150分)从这个班中任取1人,其数学成绩达到或超过年级文科平均分的概率是 .
【答案】
【解析】
15.【四川2016年普通高考适应性测试,11】某单位有500位职工,其中35岁以下的有125人,35~49岁的有280人,50岁以上的有95人,为了了解职工的健康状态,采用分层抽样的方法抽取一个容量为100的样本,需抽取35岁以下职工人数为 .
【答案】25
【解析】抽取35岁以下职工人数为
16.【2017届湖南省长沙市高三上学期统一模】空气质量指数(,简称)是定量描述空气质量状况的指数,空气质量按照
大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.某环保人士从当地某年的记录数据中,随机抽取10天的数据,用茎叶图记录如下.根据该统计数据,估计此地该年大于100的天数约为__________.(该年为365天)
【答案】146
【解析】茎叶图中大于100的天数为4天,所以 ,解得: ,所以该年大于100的天数为146天.
17. 【河南南阳一中2017届高三上学期第4次月考,18】为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:平均每天喝500以上为常喝,体重超过50为肥胖.
常喝
不常喝
合计
肥胖
2
不肥胖
18
合计
30
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为.
(1)请将上面的列联表补充完整;
(2)是否有的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;
(3)已知常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生抽取2人参加电视节目,则正好抽到一男一女的概率是多少?
参考数据:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中)
【答案】(1)列联表见解析;(2)有的把握认为肥胖与常喝碳酸饮料有关;(3).
【解析】(1)设常喝碳酸饮料肥胖的学生有人,,,
常喝
不常喝
合计
肥胖
6
2
8
不肥胖
4
18
22
合计
10
20
30
(2)由已知数据可求得:,因此有的把握认为肥胖与常喝碳酸饮料有关.
18.【2017届湖北省武汉市武昌区高三1月调研考试】我国上是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过的部分按平价收费,超过的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照,,…,分成9组,制成了如图所示的频率分布直方图.
(Ⅰ)求直方图中 的值;
(Ⅱ)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说明理由;
(Ⅲ)已知平价收费标准为4元/吨,议价收费标准为8元/吨,当时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替)
【答案】(Ⅰ);(Ⅱ)估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准;
(Ⅲ)元
【解析】(Ⅰ)由频率分布直方图,可得
,
解得.
(Ⅱ)前6组的频率之和为 ,
而前5组的频率之和为 ,
由 ,解得,
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
(Ⅲ)设居民月用水量为吨,相应的水费为元,则
,即 ,
由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
9
分组
频率
0.04
0.08
0.15
0.20
0.26
0.15
0.06
0.04
0.02
根据题意,该市居民的月平均水费估计为
19.【2017届湖北省荆、荆、襄、宜四地七校考试联盟高三2月联考】某手机厂商推出一款吋大屏手机,现对名该手机使用者(名女性,名男性)进行调查,对手机进行打分,打分的频数分布表如下:
女性用户:
分值区间
频数
男性用户:
分值区间
频数
(Ⅰ)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不要求计算具体值,给出结论即可);
(Ⅱ)分别求女性用户评分的众数,男性用户评分的中位数;
(Ⅲ)如果评分不低于分,就表示该用户对手机“认可”,否则就表示“不认可”,完成下列列联表,并回答是否有的把握认为性别和对手机的“认可”有关;
女性用户
男性用户
合计
“认可”手机
“不认可”手机
合计
附:
【答案】(Ⅰ)女性用户的波动小,男性用户的波动大(Ⅱ)(Ⅲ)有的把握
【解析】(Ⅰ)女性用户和男性用户的频率分布表分别如下左、右图:
由图可得女性用户的波动小,男性用户的波动大.
(Ⅱ)由女性用户频率分布直方图知,女性用户评分的众数为;
在男性用户频率分布直方图中,中位数两边的面积相等。设中位数为,则
于是,解得
(Ⅲ)列联表如下图:
女性用户
男性用户
合计
“认可”手机
140
180
320
“不认可”手机
60
120
180
合计
200
300
500
,所以有的把握认为性别和对手机的“认可”有关.
20.【湖南百所重点中学2017届高三阶段性诊断,18】(本小题满分12分)
已知某企业的近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:
(1)试问这3年的前7个月中哪个月的月平均利润较高?
(2)通过计算判断这3年的前7个月的总利润的发展趋势;
(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估测第3年8月份的利润.
相关公式:,.
【答案】(1)月和月的平均利润最高;(2)前个月的总利润呈上升趋势;(3)万元.
【解析】(1)由折线图可知月和月的平均利润最高.………………2分
(2)第年前个月的总利润为(百万元),………………3分
第年前个月的总利润为(百万元),………………4分
第年前个月的总利润为(百万元),………………5分
所以这年的前个月的总利润呈上升趋势.………………7分
(3)∵,,,
∴,………………9分
∴,………………10分
∴,………………11分
当时,(百万元),∴估计月份的利润为万元.………………12分
21.【2017届四川雅安中学高三文上学期月考三】为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图:记成绩不低于70分者为“成绩优良”.
(1)分别计算甲、乙两班20个样本中,化学分数前十的平均分,并大致判断哪种教学方式的教学效果更佳;
(2)由以上统计数据填写下面列联表,并判断能否在犯错误的概率不超过的前提下认为“成绩优良与教学方式有关”?
甲班
乙班
总计
成绩优良
成绩不优良
总计
附:
独立性检验临界值表:
【答案】(1),,“新课堂”的教学效果更佳;(2)列联表见解析,在犯错误的概率不超过的前提下认为“成绩优良与教学方式有关”.
【解析】(1)甲班样本化学成绩前十的平均分为
;…………………………2分
乙班样本化学成绩前十的平均分为
.………………………………4分
甲班样本化学成绩前十的平均分远低于乙班样本化学成绩前十的平均分,大致可以判断“高效课堂”教学方式的教学效果更佳.……………………………………………………6分
22.【2017届广东省珠海市高三上学期期末】某市为鼓励居民节约用水,拟实行阶梯水价,每人用水量中不超过立方米按2元/立方米收费,超出立方米但不高于的部分按4元/立方米收费,超出的部分按8元/立方米收费,从该市随机调查了 10000位居民,获得了他们某月的用水量数据,整理得到如图所示频率分布直方图:
(1)如果为整数,那么根据此次调查,为使40%以上居民在该月的用水价格为2元/立方米,至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当时,估计该市居民该月的人均水费.
【答案】(1);(2).
【解析】⑴我市居民月用水量在区间、内的频率依次为0.1、0.15、0.2,所以该月用水量不超过2立方米的居民占45%,而用水量不超过1立方米的居民点10%,所以至少定为2.
(2)根据题意,列出居民该月用水费用的数据分组与频率分布表
(每两组数据正确得1分,本表格可以以其它形式呈现,数据正确就可以得分)
该市居民该月的人均水费估计为:
(由上面表格中不多于两个数据错误,本步骤不扣分)
(元).
答:当时,该市居民改月的人均水费约为6.05元.