频率分布直方图与茎叶图_图文

用样本的频率分布估计总体分布
衡南五中 谭亮

用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图

二 频率分布折线图 和总体密度曲线



莖叶图

下表给出100位居民的月均用水量表

为此我们要对这些数据进行整理与分析

第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1 第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常分成5~12组. 为方便组距的选择应力求”取整”. 本题如果组距为0.5(t). 则

极差 4.1 组数= ? ? 8.2 组距 0.5

所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限) [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.

第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)

组距=0.5

分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计

频数 4 8 15 22 25 15 5 4 2 100

频率
0.04
0.08 0.15 0.22 0.25 0.15 0.05 0.04 0.02 1

频率/组距 0.08
0.16

0.3 0.44 0.5 0.3
0.1 0.08 0.04 2.00

第 五 步: 画 出 频 率 分 布 直 方 图.

频率/组距 (组距=0.5)
0.6
0.5 0.5请大家阅读第 0.44 67页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?

小长方形的面 月均用水量最 多的在哪个区 积总和=? 积=? 间?

0.2

0.16

0.1 0.08 0

0.1

0.08

0.04

0.5

1 1.5

2

2.5

3

3.5 4

4.5

月均用水量/t

频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。

思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?

一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6

0.5
0.4
0.44

0.5

0.3
0.2
0.16

0.3

0.3

0.1 0.08 0

0.1

0.08

0.04

0.5

1 1.5

2

2.5

3

3.5 4

4.5

月均用水量/t

总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图时所 分的组数增加,组距减少,相应的频率折线图会越来越 接近于一条光滑曲线,统计中称这条光滑曲线为总体密 度曲线. 它能够精确地反映了总体在各个范围内取值的 百分比,它能给我们提供更加精细的信息. 频率

组距

0

a

b

月均用水量/t

思考
1.对于任何一个总体,它的密度曲线是不是一定存在?它 的密度曲线是否可以被非常准确地画出来? 2.图中阴影部分的面积表示什么?

频率

组距

0

a

b

月均用水量/t

1.实际上,尽管有些总体密度曲线是客观存在 的,但一般很难想函数图象那样准确地画出来, 我们只能用样本的频率分布对它进行估计,一 般来说,样本容量越大,这种估计就越精确

二、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一 个有效数字,两边的数字表示个位数,即第二个有效数字,它 的中间部分像植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图

合作探究 :茎叶图

(一种被用来表示数据的图)

例: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好.


8 4, 6, 3 3, 6, 8 3, 8, 9 1 0 1 2 3 4 5



2, 5, 1, 4, 0

5 4 6, 1, 6, 7, 9 9







画茎叶图要注意什么:
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小 次序排成一列,写在左(右)侧; 3.将各个数据的叶按大小次序 写在其茎右(左)侧.

茎 叶 0 8 1 345 2 36 8 3 389 4 5 1

茎叶图的特征:
两个优点: 一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随 时添加,方便记录与表示。 三个局限: 一是:只便于表示两位有效数字的数据; 二是:茎叶图只方便记录两组的数据; 三是:数据量不能太大

练习:
下表一组数据是某车间30名工人加工零件的个数, 设计一个 茎叶图表示这组数据,并说明这一车间的生产情况.

134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0

小结:
1.不易知一个总体的分布情况时,往往从总体中 抽取一个样本,用样本的频率分布去估计总体的 频率分布,样本容量越大,估计就越精确. 2. 目前有:频率分布表、直方图、茎叶图. 3.当总体中的个体取值很少时,用茎叶图估计总 体的分布;当总体中的个体取值较多时,将样本 数据恰当分组,用各组的频率分布描述总体的分 布,方法是用频率分布表或频率分布直方图。


相关文档

频率分布直方图和茎叶图练习 (1)
频率分布直方图和茎叶图练习
频率分布直方图茎叶图
频率分布直方图与茎叶图概述
频率分布直方图与茎叶图.ppt
频率分布直方图及茎叶图
2.2.1频率分布表、直方图、茎叶图
频率分布直方图与茎叶图的应用
2.2.1频率分布直方图、茎叶图
频率分布直方图与折线图及茎叶图作业
电脑版