nbhkdz.com冰点文库

福建省2013届新课标高考文科数学一轮总复习课件:第64讲 抽样方法与总体分布的估计


1.会用简单随机抽样方法从总体中抽取样本; 了解分层抽样和系统抽样方法. 2.会列频率分布表,会画频率分布直方图、 频率分布折线图、茎叶图,理解他们各自特点, 会计算数据的标准差、方差,会用样本的基本 数字特征估计总体的基本数字特征,会用样本 的频率分布估计总体分布.

1.抽样方法

?1? 抽样要具有随机性、等可能性,这样才能<

br />通过对样本的分析和研究更准确的反映总体 的情况,常用的抽样方法有① ____________ 、 ② ____________ 、③ ______________ .

? 2 ? 简单随机抽样是指一个总体的个数为N (较
小的有限数),通过逐个抽取一个样本,且每 次抽取时每个个体被抽取的概率相等.简单随 机抽样的两种常用方法为④ _______ 和⑤ ___ _________ .

? 3? 分层抽样是总体由⑥ ________________ ,
常将总体按差异分成几个部分,然后按各部 分所占的比值进行抽样,其中所分成的各部 分叫做层.

? 4 ? 系统抽样是当总体中的个数较多时,将总
体均分成几部分,按事先确定的规则在各部 分抽取.

2.总体分布的估计

?1? 列频率分布表.

? 2 ? 画频率分布直方图,将区间[a,b)标在横
轴上,纵轴表示频率与组距的比值,以每个 组距为底,以各频率除以组距的商为高,分 别画矩形,共得k 个矩形,这样得到的图形 叫做⑦ ____________________ . 频率分布直方图的性质:) i个矩形的面积等 ⅰ第 ( 于样本值落入区间[ti ?1,ti )的频率; ) (ⅱ由于f1 ? f 2 ??? f k ? 1,所以所有小矩形的面积之和为1.

? 3? ⑧ _______________________ ,就得到频
率分布折线图,随着样本容量的增加,折线 图会越来越近于一条光滑曲线,称之为总体 密度曲线.

? 4 ? 茎叶图也能用来表示数据,茎是中间的一
列数,叶是从茎旁边上长出来的数,当样本 数据较少时,用茎叶图表示数据的效果更好.

3.样本的数字特征估计总体的数字特征

?1? 众数、中位数.
一组数据中出现次数⑨ ________ 的数据叫做 这组数据的众数. 将一组数据按照从大到小(或从小到大)排列, 处在⑩ ____________ 上的一个数据(或中间两 位数据的平均数)叫做这组数据的中位数.

? 2 ? 平均数和方差的计算.
ⅰ如果有n个数据x1,x2, ,xn,则 x ? ? __ () ? ________________ 叫做这组数据的平均数, s 2 ? ? _______________________________ ____ 叫做这组数据的方差,而s叫做标准差. (ⅱ)公式s 2 ? ? ________________________ . (ⅲ)当一组数据x1,x2, ,xn中各数较大时, ? 可将各数据减去一个适当的常数a,得到x1 ? ? x1 ? a,x2 ? ? x2 ? a, ,xn ? ? xn ? a,则s 2 ? ? _ ? ______________________________________ .

3? 数据x1,x2, ,xn的平均数为x,方差为s 2, ? ? 则数据y1,y2, ,yn,其中yi ? axi ? b(i ? 1, 2, ? ?,n)的平均数 y ? ? __________ ,方差s12 ? ? __________ . 4.总体平均值和方差的估计人类的长期实践 和理论研究都充分证明了同样本的平均数估 计总体平均值,用样本方差估计总体方差是可 行的,而且样本容量越大,估计就越准确.

要点指南:①简单随机抽样;②分层抽样; ③系统抽样;④抽签法;⑤随机数表法; ⑥差异明显的几部分组成;⑦频率分布直方 图;⑧连接频率分布直方图中各小长方形上 1 边的中点;⑨最多;⑩中间位置;? ( x1 ? n 1 x2 ??? xn );? [( x1 ? x ) 2 ? ( x2 ? x ) 2 ??? n 2 1 2 1 2 2 2 ( xn ? x) ];? [( x1 ? x2 ??? xn ) ? nx ];? n n ? [( x1 ? x? ??? x? ) ? nx? ];?ax ? b;?a 2 s 2
2 2 2 2 n 2

1.现要从已编号(1~50)的 50 枚最新研制的 某型号导弹中随机抽取 5 枚进行发射试验,决定 采取系统抽样的方法确定选取的 5 枚导弹的编号 可能是( ) B.1,2,3,4,5 D.3,13,23,33,43

A.5,10,15,20,25 C.2,4,8,16,32

【解析】由题设,共分 10 个系统,每个系 统 5 个个体, 1 个系统的号码是 1,2,3,4,5.若在 第 其中抽取的号码为 n0, 则第 k 个系统应抽的号码 是(k-1)×10+n0, 其中 1≤k≤10.由此可知应选 D.

2.某单位有老年人 28 人,中年人 54 人,青年人 81 人.为了解他们的学历水平,从中抽取容量为 36 的样 本,最适合的抽样方法是( A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老年人中剔除 1 人,再分层抽样 )

【解析】由题设,个体有明显差异,因此应选择 分层抽样, 但抽样比例若是 36∶163, 不能得到整数值, 而先剔除 1 名老年人后按比例 36∶162,即 2∶9,能 从各层中抽取整数个个体,故选 D.

3.一个样本数据的茎叶图如下, 其中位数为 22,则 x 的值为( )

A.1 C.0

B.2 D.3

20+x+23 【解析】 由于样本数据为偶数, 所以 22= , 2 求解 x=1,故选 A.

4.从某小学随机抽取 100 名同学,将他们的身高(单 位: cm)数据制成频率分布直方图如下, 由图中数据可知 a = 0.030 .若要从身高[120,130),[130,140),[140,150) 3 人. 三组内的学生中,用分层抽样选取 18 人参加一次活动, 则从身高在[140,150)内的学生中选取的人数为

【解析】根据(0.035+a+0.020+0.010+0.005)×10 =1,求得 a=0.030. 身高在[120,130)内的学生有 0.030×10×100=30 人, 身高在[130,140)内的学生有 0.020×10×100=20 人, 身高在[140,150)内的学生有 0.010×10×100=10 人, 则 从 身 高 在 [140,150) 内 的 学 生 中 选 取 的 人 数 为 18 ×10=3 人. 30+20+10

5.若数据 x1,x2,x3,?,xn 的平均数为 10, 方差为 8.5, 则数据 3x1+5,3x2+5,3x3+5, ?, 3xn+5 的平均数为 35 ,方差为 76.5 .

【解析】由已知,3x1+5,3x2+5,?,3xn+5 的平均 数为 3×10+5=35,标准差为 32×8.5=76.5.



用样本估计总体

【例 1】甲、乙两人参加某体育项目训练,近期的五次 测试成绩情况如图.

(1)分别求出两人得分的平均数与方差; (2)根据图和(1)算得的结果,对两人的训练成绩作出评价.

【解析】(1)甲、乙两人五次测试的成绩分别为: 甲 乙 10 分 13 分 13 分 14 分 12 分 12 分 14 分 12 分 16 分 14 分

10+13+12+14+16 甲的平均得分为 =13, 5 13+14+12+12+14 乙的平均得分为 =13. 5

1 s 甲 = [(10-13)2 +(13-13)2 +(12-13)2 +(14-13)2 5
2

+(16-13)2]=4, 1 s 乙 = [(13-13)2 +(14-13)2 +(12-13)2 +(12-13)2 5
2

+(14-13)2]=0.8.

2 (2)由 s2 >s乙可知乙的成绩较稳定. 甲

从折线图看,甲的成绩基本上呈上升状态,而乙的 成绩在平均线上下波动,可知甲的成绩在不断提高,而 乙的成绩无明显提高.

【点评】平均数与方差是重要的统计数字特征, 分别反映平均水平和波动状态, 它们的实际意义应联 系实际分析判断.

素材1

两台机床同时生产直径为 10 的零件,为了检验产品 质量,质检员从两台机床生产的产品中各抽出 4 件进行测 量,结果如下:

如果你是质检员,在收集上述数据后,你将通过怎 样的运算来判断哪台机床生产的零件质量更符合要 求?

-甲=1(10+9.8+10+10.2)=10, 【解析】 x 4 -乙=1(10.1+10+9.9+10)=10. x 4 -甲=-乙,故平均直径不能反映质量优劣. x x 1 s甲= [(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02, 4
2

1 s乙= [(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005. 4
2

2 s2 <s甲,说明乙机床生产出的零件直径波动小,由此, 乙

从质量稳定性的角度判断,乙机床生产的零件质量更符合要求.



抽样方法及实际应用

【例 2】 (2011· 佛山模拟)某电视台在一次对收看文艺 节目和新闻节目的抽样调查中,随机抽取了 100 名电视 观众,相关的数据如下表所示:

(1)用分层抽样方法在收看新闻节目的观众中随 机抽取 5 名,大于 40 岁的观众应该抽取几名? (2)在上述抽取的 5 名观众中任取 2 名,求恰有 1 名观众的年龄为 20 至 40 岁的概率.

【解析】(1)由题中所给条件,收看新闻节目的共 45 名, 5 1 随机抽取 5 名,则抽样比例为45=9,故大于 40 岁的观众应 1 抽取 27×9=3(人). (2)抽取的 5 名观众中,大于 40 岁的 3 人设为 a1,a2, a3,20 至 40 岁的 2 人设为 b1,b2,则从 5 人中抽取 2 人的基 本事件有:(a1,a2),(a1,a3),(a2,a3),(b1,b2),(a1,b1), (a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),共 10 种, 6 3 其中恰有 1 人在 20 至 40 岁的有 6 种, 故所求概率 P=10=5.

【点评】 抽样方法是样本估计总体的关键第一步,同 时三种不同的抽样方法适用的情境也各不相同,高考中 通常将抽样方法渗入直方图、茎叶图、数据统计分析和 概率计算间进行考查.

素材2

一个总体分为 A,B 两层,用分层抽样的方法从总体 中抽取一个容量为 10 的样本.已知 B 层中每个个体被抽 1 到的概率都为12,则总体中的个体数为 120 .

【解析】分层抽样是等概率抽样,故总体的个体数 1 为 10÷ =120. 12



直方图、茎叶图的应用

【例 3】某良种培育基地正在培育一种小麦新品种 A.将其与原有的一个优良品种 B 进行对照试验. 两种小 麦各种植了 25 亩,所得亩产数据(单位:千克)如下: 品种 A: 357,359,367,368,375,388,392,399,400,405,412,414,415,4 21,423,423,427,430,430,434,443,445,444,451,454 品种 B: 363,371,374,383,385,386,391,392,394,394,395,397,3 97,400,401,401,403,406,407,410,412,415,416,422,430

(1)绘出品种 A、 产量的茎叶图, B 并根据茎叶图比较 品种 A、B 的平均产量和稳定性; (2)设从品种 A 中亩产量不低于 440 千克的试验品种 中随机抽取两种进行下一年的对比试验,求亩产量 445 千克被抽中的频率.

【解析】(1)品种 A、B 的亩产量茎叶图如下:

通过茎叶图可以看出: ①品种 A 的亩产平均数比 品种 B 高;②品种 A 的亩产标准差(或方差)比品种 B 的大,故品种 A 的亩产稳定性较差. (2)设“亩产量 445 千克被抽中”为事件 A,从品 种 A 中亩产量不低于 440 千克的试验品种中随机抽取 两 种 的 所 有 基 本 事 件 有 (443,444) , (443,445) , (444,445),?,(451,454),共 10 种,事件 A 所含的 基本事件有(443,445), (444,445), (445,451), (445,454), 4 2 共 4 种,故 P(A)= = . 10 5

【点评】茎叶图中“叶”表示的数字的末位数, 由已知数据绘制茎叶图时应同“茎”的条件下,叶按 大小排列,茎叶图的优势在于直观清晰地反映数据的 分布情况,便于比较,没有信息损失,可以随时添加 新的数据.

素材3

某班同学《统计》单元测试成绩(单位:分)的频率分布条 形图如图所示.

(1)若成绩在[110,120)内的共有 20 人,求全班同学的人数; (2)请根据频率分布条形图画出频率分布直方图; (3)若成绩为 120 分及以上的为优秀,则该班同学的成绩优 秀率是多少?

【分析】 根据成绩在[110,120)内的人数和频率,可 求全班同学的人数.根据频率分布条形图画出频率分布 直方图,横轴不用变化,只需用各分数段的频率除以组 距,即可得频率分布直方图的纵轴所需数据.优秀率即 为成绩优秀的人数的频率之和.

【解析】 (1)因为成绩在[110,120)内的同学的频率为 0.4,人数为 20,故全班同学的人数为 20÷ 0.4=50. (2)由频率分布条形图,可得各分数段的同学的频率为 [100,110),0.2;[110,120),0.4;[120,130),0.2;[130,140), 0.1;[140,150],0.1.再用这些频率除以组距,即可画出频率 分布直方图,如图所示.

(3)由频率分布条形图可知,成绩为优秀的频率为 0.2+0.1+0.1=0.4, 所以该班同学的成绩优秀率是 40%.

备选例题

在生产过程中,测得纤维产品的纤度(表示纤维粗细的 一种量)共有 100 个数据,数据分组如下表:

(1)完成频率分布表,并在给定的坐标系中画出频率分 布直方图;

(2)估计纤度落在[1.38,1.50)中的概率及纤度小于 1.40 的 概率是多少? (3)统计方法中,同一组数据常用该组区间的中点值(例 如区间[1.30,1.34)的中点值是 1.32)作为代表.据此,估计纤 度的众数、平均值、中位数.

【解析】 (1)频率分布表为:

(2)纤度落在[1.38,1.50)中的概率约为 0.30+0.29+0.10= 1 0.69, 纤度小于 1.40 的概率约为 0.04+0.25+2×0.30=0.44. (3)众数 1.40. 平 均 值 = 1.32×0.04 + 1.36×0.25 + 1.40×0.30 + 1.44×0.29+1.48×0.1+1.52×0.02=1.41.

因为 0.04+0.25+0.30=0.59,所以中位数在区间 [1.38,1.42)内, 设横轴上中位数到 1.38 的距离为 x, 0.5 则 -0.04-0.25=0.21,第三个矩形的高为 0.30÷ 0.04=7.5. 所以 x=0.21÷ 7.5≈0.03, 故中位数 1.38+0.03=1.41.

1.统计的基本思想方法是用样本估计总体,即用局 部推断整体,这就要求样本应具有很好的代表性, 而样本良好客观的代表性,完全依赖抽样方法,弄 清简单随机抽样和分层抽样的客观合理性,从而会 在不同的情况下采用适当的抽样方法.掌握三种抽 样方法的抽样步骤. 三种抽样方法的比较:

2.频率分布直方图会使样本的一些数字特征更明显, 绘制频率分布直方图时,要合理分组,以便使数据中 的特征能更好地反映出来. 总体分布估计中, ? 先确定分组的组数,其方法是: ?1 最大数据与最小数据之差除以组距得组数.2 ? 计算每 ? 频数 组中的频数及频率,其中频率 ? . ? 3? 画出直方图. 总数

3.画茎叶图的步骤如下:

?1? 将每个数据分为茎(高位)和叶(低位)两部分; ? 2 ? 将最小茎和最大茎之间数按大小次序排成一列,
写在左(右)侧;

? 3? 将各个数据的叶按大小次序写在其茎右(左)侧;
4.用样本的数字特征(众数、中位数、平均数)估 计总体数字特征.


高考数学第一轮.1099 12.3 抽样方法、总体分布的估计

高考数学复习全套课件 第... 88页 1下载券 【步步高】2015届高考数... 暂无...12.3 一、知识梳理 (一)抽样 抽样方法总体分布的估计 1.简单随机抽样:设...

2015年高中数学步步高大一轮复习讲义(文科)第1讲 抽样方法与总体分布的估计

2015年高中数学步步高大一轮复习讲义(文科)第1讲 抽样方法与总体分布的估计_数学_高中教育_教育专区。第十一章 统计与概率 第 1 讲 抽样方法与总体分布的估计一、...

【导与练】(新课标)2016届高三数学一轮复习 第9篇 随机抽样与总体分布的估计学案 理

【导与练】(新课标)2016高三数学一轮复习 第9篇 随机抽样与总体分布的估计...乙的波动较小 4. (2013高考四川卷(文 7) )某学校随机抽取 20 个班,...

2015届高考人教A版数学(理)总复习配套题库:第11章 第1讲 抽样方法与总体分布的估计 Word版含解析]

2015届高考人教A版数学(理)总复习配套题库:第11章 第1讲 抽样方法与总体分布的估计 Word版含解析]_高中教育_教育专区。2015届高考人教A版数学(理)总复习配套题...

高中数学复习学(教)案(第71讲)抽样方法与总体分布的估计

抽样方法和总体分布的估计... 3页 免费 高中数学复习学(教)案(第5... 16页 10财富值 高考数学复习全套课件 第十... 88页 2财富值 高三数学第一轮复习 ...

2011届数学高考复习名师精品教案:第91课时:第十一章 概率与统计率-抽样方法、总体分布的估计

2012年高考新课标理科数学... 2012年高考全国卷(新...2011高考数学一轮复习91概... 5页 免费 第91课时...:第十一章 概率与统计率-抽样方法总体分布的估计...

2011高三数学一轮课时 第十二章 第三节 抽样方法、总体分布的估计正态分布、线性回归精练 理(全国版)

2011高三数学一轮课时 第十二章 第三节 抽样方法总体分布的估计正态分布、线性回归精练 理(全国版)_计算机软件及应用_IT/计算机_专业资料。2011高三数学一轮...

专题六 高考概率与统计命题动向

2财富值 2013高考数学命题动向分析... 暂无评价 44页 免费 2012届福建省文科高考...抽样方法,总体分布的估计,线性回归,独立性检验 等. (2)概率与统计的引入,拓...

更多相关标签