nbhkdz.com冰点文库

2.2.1(用)用样本的频率分布估计整体分布

时间:2015-10-12


2.2

用样本估计总体

2.2.1用样本的频率分布估计总体分布
第一课时

【问题】我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 制定什

么样的居民生活用水定额管理方 案,才能够使大部分居民的日常生活不 受影响?
前进 后退

通过抽样调查,获得100位居民某年的月均用水量(单位:t)
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8 2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5 2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2 2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0 1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5 1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0 1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2 1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8 1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6 1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2

思考1:上述100个数据中的最大值和最小值分别是什么?由此说明 样本数据的变化范围是什么? 0.2~4.3 思考2:如果将上述100个数据按组距为0.5进行分组,那么这些数 据共分为多少组? (4.3-0.2)÷0.5=8.2 思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组 数据的取值范围可以如何设定? [0,0.5),[0.5,1),[1,1.5),? ,[4,4.5].
前进 后退

分 组 频数累计 频数 频率 [0,0.5) 4 /样本容量 0.04 频率=频数 [0.5,1) 正 8 0.08 [1,1.5) 正 正 正 15 0.15 [1.5,2) 正 正 正 正 22 0.22 [2,2.5) 正 正 正 正 正 25 0.25 [2.5,3) 正 正 14 0.14 [3,3.5) 正 一 6 0.06 [3.5,4) 4 0.04 [4,4.5] 2 0.02 合计 100 1.00 上表称为样本数据的频率分布表.
前进 后退

为了直观反映样本数据在各组中的分布情况,我们将上述 频率分布表中的有关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O

0.5

1

1.5 2

2.5 3

3.5

4

4.5 月均用水量/t

上图称为频率分布直方图,其中横轴表示月均用 水量,纵轴表示频率/组距.

前进

后退

画频率分布直方图的步骤
第一步,求极差.(极差=样本数据中最大值与最小值的差) 第二步,决定组距与组数.
(设k=极差/组距,若k为整数,则组数=k;否则,组数=[k]+1)

第三步,根据所选组距,将数据分组. 第四步,统计频数,计算频率,制成频率分布表.
=样本数据落在各小组内的个数;频率=频数/样本容量)

(频数

第五步,画频率分布直方图. 说明: 对样本数据进行分组,组距的确定没有固定的标准, 组数太多或太少,都会影响我们了解数据的分布情况.数 据分组的组数与样本容量有关,一般样本容量越大,所分组 数越多.当样本容量不超过100时,按照数据的多少,常分成 5~12组;当样本容量n较大时,分组数一般在(1+3.3lgn) 附近选取.
前进 后退

思考4:频率分布直方图中各小长方形的面积 表示什么?各小长方形的面积之和为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O

宽度:组距
高度:
频率 组距

0.5

1

1.5 2

2.5 3 3.5

4

4.5

月均用水量/t

各小长方形的面积=频率
各小长方形的面积之和=1
前进 后退

思考5:你能根据上述频率分布直方图指出居民月均用水 量的一些数据特点吗?
频率 组距

0.5 0.4 0.3 0.2 0.1
O

0.5

1

1.5

2

2.5

3

3.5 4

4.5

月均用水量/t

(1)居民月均用水量的分布是“山峰”状的,而且是 “单峰”的; (2)大部分居民的月均用水量集中在一个中间值附近, 只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.
前进 后退

思考6:P68“探究”.

0.4 0.3 0.2 0.1
O

频率 组距

1

2

3

4

5 月均用水量/t

前进

后退

思考7:如果市政府希望85%左右的居民每月的用水量不 超过标准,根据上述频率分布表,你对制定居民月用水 量标准(即a的取值)有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 思考8:在实际中,取a=3t一定能保证85%以上的居民用水 不超标吗?哪些环节可能会导致结论出现偏差? 频率分布直方图的优点和缺点 优点:能够很容易的表示大量数据,非常直观的表明分布 形状,使我们能够看到在频率分布表中看不清的一些数据 模式. 缺点:尽管可以大致估计总体的分布情况,但不能保留原 来的数据信息,在精确度要求较高的情况下不适用.

前进

后退

练习题:

1.有一个容量为45的样本数据,分组后各组的频数如下: (12.5,15.5],3; (15.5,18.5],8; (18.5,21.5],9; (21.5,24.5],11; (24.5,27.5],10;(27.5,30.5],4. 由此估计,不大于27.5的数据约为总体的 ( A ) A.91% B.92% C.95% D.30%

2.一个容量为20的样本数据,数据分组及各组的频数如下: [10,20),2;[20,30),3;[30,40),4; [40, 50),5;[50,60),4;[60,70),2. 则样本在区间(-∞,50)上的频率为( B ) A.0.5 B.0.7 C.0.25 D.0.05
前进 后退 第二课

例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
前进 后退

(1)极差为67-28=39, 取组距为5,分为8组. 样本频率分布表:

(2)样本频率分布直方图:
频率 组距

分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67) 合 计

频数 3 3 9 16 7 5 4 3 50

频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00

0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47

(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占 70%.

52

57

62

67

年龄

前进

后退

小 结 1.频率分布是指一个样本数据在各个小范围内所占比例的 大小,总体分布是指总体取值的频率分布规律.我们通常 用样本的频率分布表或频率分布直方图去估计总体的分布 .

2.频率分布表和频率分布直方图,是对相同数据的两种不 同表达方式.用紧凑的表格改变数据的排列方式和构成形 式,可展示数据的分布情况.通过作图既可以从数据中提 取信息,又可以利用图形传递信息. 3.样本数据的频率分布表和频率分布直方图,是通过各小 组数据在样本容量中所占比例大小来表示数据的分布规律, 它可以让我们更清楚的看到整个样本数据的频率分布情况, 并由此估计总体的分布情况.
作业: P71练习:1.(1). P81习题2.2A组:2.
前进 后退

2.2

用样本估计总体

2.2.1用样本的频率分布估计总体分布
第二课时

前进

后退

新课

回顾 1.列出一组样本数据的频率分布表并画出频率分布直方 图可以分哪几个步骤进行?
第一步,求极差. 第二步,决定组距与组数. 第三步,根据所选组距,将数据分组. 第四步,统计频数,计算频率,制成频率分布表.
第五步,画频率分布直方图.

2.频率分布直方图是在平面直角坐标系中画若干个依次相 邻的小长方形,这些小长方形的宽、高和面积在数量上分 别表示什么? 组距、频率除以组距、频率.

前进

后退

回顾练

前进

后退

在频率分布直方图中,依次连接各小长方形上端的中点, 就得到一条折线,这条折线称为频率分布折线图.
频率 组距
0.5 0.4 0.3 0.2 0.1
O

0.5 1

1.5 2

2.5

3 3.5

4

4.5 月均用水量/t

思考1:当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量),随着样本容量的增加,作图时所分的 组数增多,组距减少,你能想象出相应的频率分布折线图 会发生什么变化吗?
前进 后退

频率 组距

总体密度曲线

a b 月均用水量/t 在上述背景下,相应的频率分布折线图越来越接近于一条 光滑曲线,统计中称这条光滑曲线为总体密度曲线. 思考2:图中红色阴影部分的面积有何实际意义? 总体在区间(a,b)内取值的百分比.
前进 后退

O

思考3:可以用样本的频率分布折线图得到准确的总体密 度曲线吗?
结论:尽管有些总体密度曲线是客观存在的,但一般很难像 函数图象那样准确地画出来,我们只能用样本的频率分布对 它进行估计,一般来说,样本容量越大,这种估计就越精确. 频率分布折线图是随着样本而变化的,因此并不能由频 率折线图得到准确的总体密度曲线.

茎叶图
茎叶是一种形象的说法,表明两部分数据间的关系, 茎是指数据中用来分组的依据数,叶是指被分到这组的数. 它的中间部分像植物的茎,两边部分像植物茎上长出来 的叶子,因此通常把这样的图叫做茎叶图.
前进 后退

【问题】 某赛季甲、乙两名篮球运动员每场比赛的得分 情况如下:
甲得分:13,51,23,8,26,38,16,33,14,28,39; 乙得分:49,24,12,31,50,31,44,36,15,37,25,36,39.

助教在比赛中将这些数据记录为如下形式:
6 8 9 4 6 8 甲 8 3 3 3 1 乙 0 1 2 3 4 5 2 4 1 4 0 5 5 1 9

6

6

7

9

思考4:你能理解这个图是如何记录这些数据的吗?你能 通过该图说明哪个运动员的发挥更稳定吗?
前进 后退

练习:对于样本数据: 3.1,2.5,2.0,0.8,1.5, 1.0,4.3,2.7, 3.1,3.5,用茎叶图如 何表示?

茎 0 1 2 3 4

叶 8 0 5 0 5 1 1 3

(1)将每个数据分为“茎”(高位)和 “叶”(低位)两部分; (2)将最小茎和最大茎之间的数按大 小次序排成一列,写在左(右)侧; (3)方便起见可将各个数据的叶按大 小次序写在茎右(左)侧. 说明:
①茎和叶的划分,可以根据数据的特点灵 活的决定,例如数据由整数部分和小数部 分组成时,可把整数部分作为茎,小数部 分作为叶. ②在写叶上的数字时,可不按大小顺序, 但按大小顺序写更有利于观察数据的分布 情况.
前进 后退

7 5

一般地,画出 一组样本数据的茎 叶图的步骤如下:

思考5:用茎叶图处理样本数据有何好处,什么时候用茎 叶图会比较方便?

结论:茎叶图不仅能够保留原始数据,数据可以随时记 录,随时添加,方便记录, 而且能够展示数据的分布情况, 但其仅适用于样本数据较少时,否则枝叶会太长. 思考6:比较茎叶图和频率分布表,茎叶图中“茎”和 “叶”的数目分别与频率分布表中哪些数目相当? 结论:茎相当于频率分布表中的分组,茎上叶的数目相 当于频率分布表中指定区间的频数.

前进

后退

知识迁移
例1 在某小学500名学生中随机抽样得到 100人的身高如下表(单位cm) :
身高区间
[122,126) [126,130) [130,134) [134,138) [138,142)





2

8

9
[150,154)

18
[154,158)

28

身高区间

[142,146) [146,150)





15

10

6

4

(1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计该校学生身高小于134cm的人数约 为多少?

(1)频率分布表:
分 组 频数 频率

[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158)
合 计

2 8 9 18 28 15 10 6 4
100

0.02 0.08 0.09 0.18 0.28 0.15 0.10 0.06 0.04
1.00

(2)频率分布直方图:
频率 组距

0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
O
122 126 130 134 138 142 146 150 154 158

身高/cm

(3)(0.02+0.08+0.09)×500=95(人)

例2 为了了解高一学生的体能情况,某校随 机抽取部分学生进行一分钟跳绳次数测试,将所 得数据整理后,画出了频率分布直方图.图中从左 到右各小长方形的面积之比为2:4:17:15:9: 3,第二小组的频数为12. 频率/组距 (1)第二小组的频 0.036 0.032 率是多少? (2)样本容量是多 0.028 0.024 少? 0.020 (3)若次数在110以 0.016 上(含110次)为达 0.012 标,试估计该校全体 0.008 0.004 高一学生的达标率约 o 90 100 110 120 130 140 150 次数 是多少?

小结作业
1.用样本的频率分布估计总体分布,当总体 中的个体数取值很少时,可用茎叶图估计总 体分布;当总体中的个体数取值较多时,可 将样本数据适当分组,用频率分布表或频率 分布直方图估计总体分布. 2.总体密度曲线可看成是函数的图象,对一 些特殊的密度曲线,其函数解析式是可求的. 3.茎叶图中数据的茎和叶的划分,可根据 样本数据的特点灵活决定.

作业: P71练习:3. P81习题2.2 A组: 1.(1)(2)(3).

例2.下表给出了某校500名12岁男孩中用 随机抽样得出的120人的身高(单位cm) (1)列出样本频率分布表﹔ (2)估计身高小于134cm的人数占总人数的 百分比.。
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146)

人数
区间界限 人数

5

8

10

22

33

20

[146,150) [150,154) [154,158) 11 6 5

解:(1)样本频率分布表如下:
分组 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 合计 频数 5 8 10 22 33 20 11 6 5 120 频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1

(2)由样本频率分布表可知身高小于 134cm 的男孩出现的频率为0.04+0.07+ 0.08=0.19, 所以我们估计身高小于134cm的人数

占总人数的19%.

例3.为了了解一大片经济林生长情况, 随机测量其中的100株的底部 周长,得到 如下数据表(单位:cm)
135 125 109 105 98 97 124 123 102 117 87 111 110 113 131 103 99 110 97 105 121 92 102 92 110 102 123 114 96 109 104 108 100 104 104 104 103 112 128 102

129
111 129 99

126
89 99 101

97
110 90 116

100
121 99 97

115
80 121 102

111
120 123 108

106
121 107 101

117
104 111 95

104
108 91 107

109
118 100 101

102
123

108
119

117
98

99
121

118
101

106
113

119
102

97
103

126
104

108
108

(1)编制频率分布表; (2)绘制频率分布直方图;

(3)估计该片经济林中底部周长小于100 cm的树木约占多少,周长不小于120cm 的树木约占多少.

解:(1)这组数据 [80,85) 的最大值为135,最 [85,90) [90,95) 小值为80,全距为55, [95,100) 可将其分为11组,组 [100,105) 距为5.频率分布表 [105,110) [110,115) 如下: [115,120)

分组

频率/组 频数 频率 距 1 0.01 0.002 2 4 0.02 0.04 0.004 0.008

14 24 15 12 9 [120,125) 11 [125,130) 6 [130,135] 2 100 合计

0.14 0.24 0.15 0.12 0.09 0.11 0.06 0.02 1

0.028 0.048 0.030 0.024 0.018 0.022 0.012 0.004 0.2

(2)直方图如图

(3)从频率分布表得,样本中小于100的 频率为0.01+0.02+0.04+0.14=0.21,样本中 不小于120的频率为0.11+0.06+0.02=0.19,
估计该片经济林中底部周长小于100cm 的树木约占21%,周长不小于120cm的树 木约占19%.

3. 从高三学生中抽取50名同学参加数学 竞赛,成绩的分组及各组的频数如下: (单位:分)[40,50),2;[50,0),3; [60,70),10;[70,80),15;[80,90), 12;[90,100),8; (1)列出样本的频率分布表(含累计频率); (2)画出频率分布直方图; (3)估计成绩在[60,90)分的学生比例; (4)估计成绩在85分以下的学生比例。

解:(1)频率分布表如下:

(2)频率分布直方图如下:

(3)估计成绩在[60,90)分的学生比例;
解:(3)成绩在[60,90)的学生比例即为 学生成绩在[60,90)的频率,0.2+0.3+0.24 =0.74. (4)估计成绩在85分以下的学生比例。 (4)成绩在85分以下的学生比例即为学生 成绩不足85分的频率,设相应频率为b,
b ? 0.6 0.84 ? 0.6 由 85 ? 80 ? 90 ? 80

,故b=0.72,估计成绩在

85分以下的学生约占0.72.

4. 一个容量为100的样本,数据的分组和 各组的一些相关信息如下:

(1)完成上表中每一行的两个空格; (2)画出频率分布直方图; (3)根据累计频率分布图估计,总体中 小于22的样本数据大约占多大的百分比?

(1)补全后的频率分布表如下:
0.06 8 16 18 10 5 0.21 0.18 0.16 0.05 0.06 0.14 0.30 0.51 0.85 0.95

(2) 频率分布直方图:
频率 组距 0.06

0.04

0.02 x 12 15 18 21 24 27 30 33 36

(3)根据累计频率分布图估计,总体中 小于22的样本数据大约占多大的百分比? 解:(3)在这个分布图上,横坐标为22 落在[21,24)内,分布图在这段区间上的 线段所在的直线方程是:
0.51 ? 0.3 y ? 0.3 ? ( x ? 21) ? 0.07( x ? 21) 24 ? 21

当x=22时,y=0.37, 因此总体中小于22的样本数据大约占0.37.


2.2.1 用样本的频率分布估计总体的分布(习题课)

64.5) kg 的学 生人数是( ) 课时安排 【学习目标】 【重点难点】 2.2.1 用样本的频率分布估计 1 课时 课题 总体的分布(习题课) 能通过频率分布直方图解决...

2.2.1用样本的频率分布估计总体分布 教案(人教A版必修3)

2.2.1用样本的频率分布估计总体分布 教案(人教A版必修3)_高一数学_数学_高中教育_教育专区。2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布 整体...

2.2.1用样本的频率分布估计总体分布(教案)

必修三教学目标 知识与技能 2.2.1 用样本的频率分布估计总体分布(教案)高一数学组 许静 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会...

2.2.1 打印用样本的频率分布估计总体分布 .doc

2.2.1 打印用样本的频率分布估计总体分布 .doc_数学_高中教育_教育专区。第...思考 2 为了了解全市居民日常用水量的整体分布情况,用怎样的方法了解? 例 1 ...

2.2.1 用样本的频率分布估计 总体的分布(人教A版必修3)

2.2.1 用样本的频率分布估计 总体的分布(人教A版必修3)_高一数学_数学_高中教育_教育专区。§ 2.2 2.2.1 用样本估计总体 用样本的频率分布估计 总体的...

2.2.1用样本的频率分布估计总体分布 教案(人教A版必修3...

2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布 整体设计 教学分析 教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问 题...

2.2.1用样本的频率分布估计总体分布 教案(人教A版必修3)

2.2.1 用样本的频率分布估计总体分布 ●三维目标 1.知识与技能 (1)通过实例体会分布的意义和作用. (2)在表示样本数据的过程中学会列频率分布表画频率分布...

2.2.1 用样本的频率分布估计总体分布

第一课时 2.2.1 用样本的频率分布估计总体分布(一) 教学要求:通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、 画频率分布直方图、频率...

10-2.2.1用样本的频率分布估计总体分布

2.2.1 用样本的频率分布估计总体分布(2) 教材分析本节内容是数学 3 第二章 统计 的第二节 用样本的频率分布估计总体分布 第二课时,是在学习了频率 分布...

2015高中数学 2.2.1用样本的频率分布估计总体分布总结 ...

2.2.1 用样本的频率分布估计总体分布(结)列频率分布表、画频率分布直方图、折线图 [例 1] 美国历届总统中,就任时年纪最小的是罗斯福,他于 1901 年就任,当时...