活页练习题


班级:

学号:

姓名:

统计学习题活页 2012 年版

第三章

统计表与统计图

1. 根据有关汽车信息数据集 ex3_1, (1)按“产地”计算平均每加仑油可行走的英里数(不考虑权数) , 回答问题。 (2)按“汽缸数”计算平均每加仑油可行走的英里数(不考虑权数) ,回答问题。 (3)按“产 地”和“汽缸数”交叉分类计算平均每加仑油可行走的英里数(保留两位小数) ,作出标准的统计表。 问: (1)哪个产地平均每加仑油可行走的英里数最多_________; 哪个产地平均每加仑油可行走的英里数最少______________。 (2)汽缸数为 4 的车平均每加仑油可行走的英里数为__________; 汽缸数为 8 的车平均每加仑油可行走的英里数为__________。

2. 根据有关 1995 年各国信息数据集 ex3_2, (1)将所有国家按“地区类型”进行分类,回答问题; (2) 将各国人口分为 5 组, 生成新变量 “人口类型” (分組) 500 万人 : (不包括 500 万) 以下为特小国; 500-1000 万人(不包括 1000 万)为小国;1000-5000 万人为中等国家;5000-1 亿人为大国;1 亿人以上为特大国, 回答问题; (提示:用 Excel 帮助功能学习 IF 函数的用法) (3)按“人口类型”和“地区类型”交叉分类 计算平均人均 GDP(不考虑人口权数,保留到整数) ,作出标准的统计表。 问: (1)拉丁美洲有__________个国家; OECD 有__________个国家。 (2)特大国有________个国家,占所有国家个数的百分比为_______。 特小国有________个国家,占所有国家个数的百分比为_______。

3. 四 位 同 学 组 成 社 会 实 践 小 组 , 用 一 周 的 时 间 销 售 各 类 报 纸 与 杂 志 。 根 据 四 人 的 销 售 记 录 ex3_3_1~ex3_3_4,汇总出各类报纸与杂志的销售量。问: (1) “扬子晚报”在一周中销售总量是_________, (2) “扬子晚报”周一的销售量是_________,其原始资料是: (3) “读者”在一周中的销售总量是_________, (4) “读者”周一的销售量是_________,其原始资料是: (5)四位同学在一周内共销售了多少报纸与杂志? ________ (6)哪天销售的报纸与杂志的总量最多?________,销售了多少? ________

4. 根据数据集 ex3_2,用 Excel 绘图功能分别绘制条形图和饼图以反映 1995 年人口类型数据。手绘出统计 图的大概形状。

5. 根据数据集 ex3_4 提供的 1952-2009 年江苏地区生产总值指标,绘制趋势图。根据 Excel 作出的图形, 手绘出该趋势图的大概形状。 (请大家用折线图和散点图分别作图,考虑一下对于我们给出的资料,应该 用哪个作图功能是正确的。 )

1

班级:

学号:

姓名:

统计学习题活页 2012 年版

第四章

数据的描述性分析
企业数(个) 19 30 42 18 11 120

1.在某地区随机抽取 120 家企业,按利润额进行分组后结果如下: 按利润分组(万元) 300 以下 300-400 400-500 500-600 600 以上 合 计

要求: (1)计算 120 家企业利润额的平均数; (2)计算 120 家企业利润额的标准差与标准差系数。

2.某公司所属三个企业生产同种产品,2007 年实际产量、计划完成情况及产品优质品率资料如下: 企 甲 乙 丙 业 实际产量(万件) 完成计划(%) 100 150 250 120 110 80 实际优质品率(%) 95 96 98

要求: (1)计算该公司产量计划完成百分比; (2)计算该公司实际的优质品率。

3. 一家公司在招收职员时都要求进行两项能力测试。 A 项测试中, 在 其平均分是 100 分, 标准差是 15 分; 在 B 项测试中,其平均分是 400 分,标准差是 50 分。一位应试者在 A 项测试中得了 115 分,在 B 项测试 中得了 425 分。与平均分相比,该位应试者哪一项测试更为理想?

4.一种产品需要工人组装,现有 3 钟可供选择的组装方法。为检验哪种方法更好,随机抽取了 15 个工人, 分别用这 3 钟方法组装,数据如下: (单位:个) 方法 A 164 167 168 165 170 165 164 168 164 162 163 166 167 方法 B 129 130 129 130 131 130 129 127 128 128 127 128 128
2

方法 C 125 126 126 127 126 128 127 126 127 127 125 126 116

班级:

学号:

姓名:

统计学习题活页 2012 年版

166 165

125 132

126 125

(学习如何把 word 中的数据复制到 excel 中) 你准备用那些统计量来评价组装方法的优劣?请把这些统计量的具体数值计算出来,并列表表示。 如果让你选择一种方法,你会作出怎样的选择?试说明理由。

5.打开 ex4_5,其中有 20 个数据。 要求: (1)计算这组数据的算术平均数、调和平均数和几何平均数, (2)比较三种平均数的大小; (3)将 这组数据减少 10、增加 10,计算新生成的两组数列的算术平均数、标准差和标准差系数; (4)将这组数 据乘以 10、除以 10,计算新生成的两组数列的算术平均数、标准差和标准差系数。

6.打开 ex4_6,其中是经济学专业 2 个班级的微积分的期末考试成绩。要求: (1)计算这个专业微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计”; ) (2)分别计算这两个班级微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计” ; ) (3)分别统计并做表列出两个班级各档分数的次数(用函数“Frequency” )与所占比重、列出向上、向下 累计的次数与频率。

7.打开 ex4_7,其中是 2005 年江苏省 52 个县市人均地区生产总值。要求计算各项指标、选择答案: (1)江苏省 52 个县市的平均人均地区生产总值是多少元? A. 20725 B. 18674 C. 15721 D. 19711 E.85124 (2)江苏省 52 个县市人均地区生产总值的标准差是多少? A. 36023 B. 11969 C. 9837 D. 5632 E. 21773 (3)江苏省 52 个县市人均地区生产总值的中位数是多少? A. 6923 B. 4292 C. 13119 D. 5798 E. 14992 (4)江苏省 52 个县市人均地区生产总值的偏态系数是多少? A. 0.55 B. -1.23 C. 2.56 D. 2.48 E. -0.10 (5)江苏省 52 个县市人均地区生产总值的峰度系数是多少? A. 8.92 B. -5.28 C. 2.02 D. 6.57 E. -0.54 (6)江苏省 52 个县市人均地区生产总值的全距是多少? A. 10964 B. 108647 C. 108586 D. 32948 E. 25124 (7)根据斯透奇斯规则对 52 个县市数据进行分组,组数是多少? A. 9 B. 5 C. 7 D. 6 E. 8 (8)若采用等距数列,根据组数和全距的关系,确定的组距是多少? A. 18500 B. 16300 C. 29400 D. 17000 E. 23200 (9)人均地区生产总值在 20600~36900 元之间的县市个数是多少? A. 35 B. 8 C. 5 D. 6 E. 20 (10)人均地区生产总值大于 20600 元的县市个数占全部县市比例是多少? A. 32.7% B. 20.2% C. 25.0% D. 15.6% E. 28.8%

3

班级:

学号:

姓名:

统计学习题活页 2012 年版

第五章 参数估计
2 1. 一农场种植苹果用于生产果冻,假设苹果的甜度为 X ,服从正态分布 N ( ?, ? ) ,从 30 辆卡车苹果中,随

机抽取样本,每辆车取一个,然后测量甜度,结果存放在 ex5_1 中,分别用 t 统计量和 z 统计量求出苹果 平均甜度 ? 的 90%、95%、95.45%、99%和 99.73%置信区间,并观察比较两者区间的大小。 (注意学习 Excel 中的函数 TINV 和 NORMSINV)
2 2 2. 和 Y 分别表示下肢瘫痪和正常成年男子的血液容量, X 单位 ml, 假设 X 服从 N ( ?1 , ? ) , 服从 N ( ? 2 , ? ) 。 Y

某医院在 1 天中对 X 做了 7 次观测,对 Y 做了 10 次观测;在一周内对 X 做了 38 次观测,对 Y 做了 31 次观测,数据保存在 ex5_2 中。 (1)根据 1 天的资料,求 ?1 ? ? 2 的 95%置信区间; (2)根据 1 周的资料, 求 ?1 ? ? 2 的 95%置信区间。请用两种方法做,并比较结果。

3. 南京财经大学欲对学生的每月的消费支出进行调查,从 200 个班级中按不重复抽样方式随机抽取 20 个 班级作为样本,登记 20 个班级全体同学的每月消费支出,数据保存在 ex5_3 中-第一种情况。请以 90%的 置信水平推断学校学生月消费支出的可能范围。若被抽中的 20 个班级,不是登记所有学生的支出,而是 再从每个班级中抽选 30 人进行登记,数据保存在 ex5_3 中-第二种情况,请仍以 90%的置信水平推断学校 学生月消费支出的可能范围。 4.在一项政治选举中,一位候选人在选民中随机地做了一次调查,结果是 351 名投票者中有 191 人支持 他,求全部选民中支持他的选民所占比重的 95%的置信区间。 5.某企业对一批产品进行质量检验,这批产品的总数为 5000 件,过去几次同类调查所得的产品合格率为 93%、95%和 96%,为了使合格率的允许误差不超过 3%,在 99.73%的概率下应抽查多少件产品? (提示:按重复抽样和不重复抽样分别计算)

6. 数据库 ex5_6 中存放着从某公司所有职工中随机抽取的 412 人调查每月工资收入状况的调查数据。 (1) 被调查职工的月平均工资是( ) 。A.2198.2 B. 2541.1 C. 2961.5 C. 824.5 C. 153 ) 。 ) 。 D. 2847.5 D. 837.1 D. 260 (2) 被调查职工的月工资收入的标准差( (3) 月收入在 2500 元及以上职工人数有( A. 2887-3051 A. 58.6%-68.1% B. 2787-3081 C. 2868-3151 ) 。A. 840.2 )人。A. 152 D. 2878-3045 D. 51.8%-65.5% B. 846.8 B. 261

(4) 以 95.45%的置信水平推断该公司职工月平均工资所在的范围是(

(5) 以 95.45%的置信水平推断月收入在 2500 元及以上职工占全部职工中的比重所在的范围是( B. 57.8%-69. 7% C. 57.8%-65.2%

7.技术人员要比较两种零件的长度,以 X 和 Y 分别表示零件甲和零件乙测量的结果, ?1 和 ? 2 分别表示 X 和 Y 的均值;研究者对这两种零件分别测量了 60 个零件(注意:此为大样本情形) ,数据存放在数据库 ex5_7 中。 (1) 以 90%的置信水平推断零件甲平均长度 ?1 的范围是( A. 5.1-5.9 A. 7.9-8.3 A. 2.2-2.8 B. 5.6-5.9 B. 7.1-8.9 B. 2.4-2.9 C. 5.2-5.6 C. 7.3-8.8 C. 2.0-2.3 D. 5.4-5.8 D. 7.6-8.9 (2) 以 90%的置信水平推断零件乙平均长度 ) 。 ) 。 ) 。

? 2 的范围是(

(3) 以 90%的置信水平确定两种零件长度之差

?2 ? ?1 的置信区间是(
D. 2.6-3.4

4

班级:

学号:

姓名:

统计学习题活页 2012 年版

第六章 假设检验
1.从 2011 年的新生婴儿中随机抽取 100 名,测得其平均体重为 3180g,样本标准差为 250g。在过去的十 年,统计资料显示新生婴儿的平均体重为 3140g。 (1)问现在的新生婴儿的体重是否有显著变化( ? ? 0.05 )? 请用 t 统计量。 (2)如果将样本量增加到 200 名,测得的指标不变,再问现在的新生婴儿的体重是否有显著变化 ( ? ? 0.05 )? 请分别用 t 统计量和 z 统计量,并观察两者的差别。 (3)如果将显著性水平提高到 ? ? 0.01 , (2)的结论又如何?

2.根据以往的经验我们可以假定英语四级考试的成绩是服从正态分布的,已知所在市参考学生的四级考 试成绩平均为 450 分。随机抽查了我们学校 25 名参考学生的成绩,数据在 ex6_2 中。问: (1)我们学校 四级考试的成绩是否和所在市的成绩显著不同; (2)我们能否认为我校学生四级水平显著高于所在市的水 平。 ? ? 0.05 ) (

3.检查一批保险丝,假设熔化时间服从正态分布,甲、乙两学生分别抽取 16 根保险丝,记录下在通过强 电流后熔化所需时间(秒) ,数据在 ex6_3 中。 (1)分别用甲、乙两学生的测量数据进行检验,能否认为 这批保险丝的平均熔化时间小于 63 秒( ? ? 0.05 )?(2)把两个学生的数据合在一起作为一个大样本进 行检验,能否认为这批保险丝的平均熔化时间小于 63 秒( ? ? 0.05 )?

4. 某企业声明有 50%以上的消费者对其产品质量满意。 假如你是某调查公司是实习生被要求随机调查 500 名消费者,你花了二天的时间收集了资料,数据存放在 ex6_4 中。请问在 500 名被调查者中有多少人对该 企业的产品质量是满意的?(提示:用 countif 函数) 试在显著性水平 0.05 下,检验调查结果是否支持企业 的自我声明。 如果要支持企业的声称,样本中至少要有多少人是“满意”的( ? ? 0.05 )?

5.南京财经大学某教师去年所授 4 个班共 207 人的“统计学”课程平均成绩为 82 分。今年该教师进行了 本课程较成功地教学改革,于是声称今年自己所授 3 个班共 154 人的该课程平均成绩将比去年高。现在要 求你对该教师的声称进行假设检验 ( ? ? 0.05 )。 ex6_5 是今年该教师所授本课程 3 个班级中随机抽取的已 批阅 36 份学生试卷(假设考试已结束) 。 (1)你所选取的原假设最好是 ( ) A. u≤82 B. u≥82 C. u<82 D. u>82 (2)你计算出的 t = ( ) C. 0.7417 D. 1.798658

A. 1.711563 B. 0.6998 (3)你计算出的 p—值= ( )

5

班级:

学号:

姓名:

统计学习题活页 2012 年版

A. 0.050121 B. 0.3014 C. 0.040351 D. 0.2443 (4)你得到的结论是 ( ) A. 不能拒绝 u≥82 B. 拒绝 u<82 C. 不能拒绝 u≤82 D. 接受 u>82 ? =0.01,你得到的结论是 ( (5)若选用 ) A. 不能拒绝 u≥82 B. 无理由拒绝 u≤82 C. 拒绝 u<82 D. 接受 u>82

6. 某教师今年“统计学”课程授课对象为经济学专业(代号 1)158 人和贸易经济专业(代号 2)203 人。从该课 程期中考试情况看,学生均分前者高于后者 2 分。该教师声称,该课程期末考试成绩学生均分前者会高于 后者。 现在要求你对该教师的声称进行假设检验 ( ? =0.01)。 ex6_6 存放着经济学专业和贸易经济专业期末 考试成绩 36 个学生的样本资料。假定两个专业学生考分的总体方差相等。 (1)你所选取的原假设最好是 ( ) A. u1-u2≥0 B. u1-u2>0 C. u1-u2<0 D. u1-u2≤0 (2)你计算出的 t = ( )

A. 2.6837 B. 3.7756 C. 3.0021 D. 2.4438 (3)你计算出的 p-值= ( ) A. 0.0052 B. 0.0045 C. 0.0063 D. 0.0036 (4)你得到的结论是 ( ) A. 拒绝 u1-u2≥0 B. 拒绝 u1-u2≤0 C. 无理由拒绝 u1-u2≤0 D. 无理由拒绝 u1-u2<0 (5)若选用 ? =0.05,你得到的结论是 ( ) A. 无理由拒绝 u1-u2≤0 B. 接受 u1-u2≤0 C. 接受 u1-u2>0 D. 拒绝 u1-u2≥0

6

班级:

学号:

姓名:

统计学习题活页 2012 年版

第七章
序号 1 2 3 4 5 6 7 8 9 10 11 12

方差分析
超市位置

1. 根据下表数据,检验超市位置对销售额是否有显著影响 (α =0.05) 。 不同位置超市的销售额数据 商业区 410 305 450 380 310 390 590 480 510 470 415 390 居民小区 265 310 220 290 350 300 445 480 500 430 428 530 写字楼 180 290 330 220 170 256 290 283 260 246 275 320

(1)本题的原假设是什么? 若成立表示什么意思? (2)列式计算均方 MSA 及 MSE 各为多少? (3)列出计算结果并说明超市位置对销售额是否有显著性影响?

2.有 4 个品牌的手机在五个地区销售,不考虑品牌和地区的搭配对销售量产生的新效应,每个品牌在各 地区的销售量如下表所示,分析不同品牌和销售地区对手机的销售量是否有显著性影响?(α =0.05) 。 4 个品牌手机在 5 个地区的销售量数据 地区因素 地区 1 品牌 1 品牌因素 品牌 2 品牌 3 品牌 4 789 698 766 758 地区 2 360 368 323 358 地区 3 377 363 356 369 地区 4 247 258 260 265 地区 5 323 333 336 337

(1)列出计算结果,不同品牌对手机销售量有影响吗? (2)列出计算结果,不同地区对手机销售量有影响吗?

3.比较 3 种化肥(A、B 两种新型化肥和传统化肥)施撒在三种类型(酸性、中性和碱性)的土地上对作 物的产量情况有无差别,将每块土地分成 6 块小区,施用 A、B 两种新型化肥和传统化肥。收割后,测量 各组作物的产量, 得到的数据如下表。 化肥、 土地类型及其它们的交互作用对作物产量有影响吗? (α =0.01) 化肥 种类 A B 土 酸性 50, 55 51, 53
7

地 碱性 52, 50 52, 50

中性 51, 52 56, 55

班级:

学号:

姓名:

统计学习题活页 2012 年版

传统

47, 45

49, 47

48, 45

4.五商店以各自的销售方式卖出新型健身器,连续五天各商店健身器的销售量如 ex7_4 所示。销售量服 从正态分布,且具有方差齐性(α =0.01) ,问: (1)该方差分析的备择假设是:A. C.

?1 ? ? 2 ? ? 3 ? ...... ? ? 5
?1 , ? 2 , ? 3 ,......, ? 5 不全相等

B.

?1 ? ? 2 ? ? 3 ? ...... ? ? 5
?1 , ? 2 , ? 3 ,......, ? 5 全不相等

D.

(2)水平间离差平方和 SSA 的自由度是:A.4 B.20 C.24 D. 46 (3)检验统计量为:A. 240.34 B. 61.626 C.4.43069 D.3.9 (4)结论是:A.5 种销售方式法有显著性差别 B. 5 种销售方式无显著性差别 C. 无法判断 D. 5 种销售方式均值相等 (5)如果想知道具体哪些销售方式有差异可采用什么方法? A. 方差分析 B. 假设检验 C. 回归分析 D.多重比较 5.某商品不同的装潢(因素 A) ,在五个地区(因素 B)销售。销售资料如 ex7_5 所示。销售量服从正态分 布,且具有方差齐性,假设两因素无交互作用(α =0.05) 。问: (1)对地区因素,该方差分析的备择假设是: A. C.

?1 ? ? 2 ? ? 3 ? ...... ? ? 5
?1 , ? 2 , ? 3 ,......, ? 5 不全相等

B.

?1 ? ? 2 ? ? 3 ? ...... ? ? 5
?1 , ? 2 , ? 3 ,......, ? 5 全不相等

D.

(2)总离差平方和的分解是:A. SST = SSA + SSB B.SST = SSA + SSE C. SST = SSA + SSB + SSE D. SST = SSA + SSB + SSAB + SSE (3)水平间离差平方和 SSA 的自由度是:A.4 B.2 C.14 D. 8 (4)装潢因素的检验统计量为:A. 1.7019 B. 1.3206 C.3.8378 D.4.4589 (5)结论是:A.5 个销售地区有显著性差别 B. 不同装潢有显著性差别 C. 无法判断 D. 不同地区及不同装潢对销售影响均不显著 6. 一家超市连锁店进行了一项研究,想确定超市所在地的位置(因素 A)和竞争者的数量(因素 B)及 两因素的交互作用对销售额是否有显著性影响,将超市位置按商业区、居民小区和写字楼分成三类,并在 不同位置分别随机抽取 3 家超市,竞争者数量按 1 个、2 个、3 个和三个以上分四类,获得的年销售额如 ex7_6 所示(α =0.05) 。问: (1)对位置因素,该方差分析的备择假设是: A.

?1 ? ? 2 ? ? 3

B.

?1 ? ? 2 ? ? 3

C.

?1 , ? 2 , ? 3 不全相等

D.

?1 , ? 2 , ? 3 全不相等

(2)总离差平方和的分解是:A.SST = SSA + SSB B. SST = SSA + SSE C.SST = SSA + SSB + SSE D. SST = SSA + SSB + SSAB + SSE (3)水平间离差平方和 SSB 的自由度是:A.2 B.3 C.6 D. 24 (4)A 因素的检验统计量为:A.35.7714 B. 14.8920 C.3.2838 D.3.4028 (5)结论是:A.超市的三个位置没有显著性差别 B. 竞争者个数多少没有显著性差别 C. 交互作用对销售没有显著性影响 D. 两因素及交互作用对销售均有显著影响

8

班级:

学号:

姓名:

统计学习题活页 2012 年版

第九章 相关与回归分析
1.从某一行业中随机抽取 12 家企业,所得产量与其单位成本数据如下: 企业编号 1 2 3 4 5 6 产量 (台) 单位成本(台/元) 企业编号 40 42 50 55 65 78
185 175 172 170 169 164

产量 (台) 单位成本(台/元) 84 100 116 125 130 140
156 142 140 135 130 124

7 8 9 10 11 12

(1)绘制产量与单位成本的散点图,判断二者之间的关系形态。 (2)计算产量与单位成本之间的线性相关系数,并对相关系数的显著性进行检验( ? ? 0.05 ) ,说明二者 之间的关系强度。 (3)以产量为自变量,单位成本为因变量,拟合直线回归方程,并对方程和系数进行显著性检验。

2.下面是某年 7 个地区的人均 GDP 和人均消费水平的统计数据: 地区 1 2 3 4 5 6 7 人均 GDP(元) 人均消费水平 (元) X Y 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035

(1)画出相关图,并判断人均 GDP 与人均消费水平之间对相关方向; (2)计算相关系数,指出人均 GDP 与人均消费水平之间的相关方向和相关程度; (3)以人均 GDP 为自变量,人均消费水平作因变量,拟合直线回归方程; (4)计算估计标准误差

S yx



(5)对回归系数进行检验(显著性水平取 0.05); (6)在 95%的概率保证下,求当人均 GDP 为 5000 元时,人均消费水平的置信区间。

3. 经过研究,发现家庭书刊消费水平受家庭收入及户主受教育年数的影响。现对某地区的家庭进行抽样 调查,得到样本数据如下表所示,其中 y 表示家庭书刊消费水平(元/年) 表示家庭收入(元/月) 表 ,x ,T 示户主受教育年数。 家庭书刊消费 y 450.0 507.7 613.9 563.4 501.5 781.5 家庭收入 x 1027.2 1045.2 1225.8 1312.2 1316.4 1442.4
9

户主受教育年数 T 8 9 12 9 7 15

班级:

学号:

姓名:

统计学习题活页 2012 年版

541.8 611.1 1222.1 793.2 660.8 792.7 580.8 612.7 890.8 1121.0 1094.2 1253.0

1641.0 1768.8 1981.2 1998.6 2196.0 2105.4 2147.4 2154.0 2231.4 2611.8 3143.4 3624.6

9 10 18 14 10 12 8 10 14 18 16 20

(1)以 y 为因变量,x 与 T 为自变量建立多元线性回归方程。 (2)对回归模型显著性检验。 (3)对回归系数进行显著性检验。

4.假设某企业在 15 年中每年的产量 Y(件)和总成本上 X(元)的统计资料如下所示。试拟合以下总成 本函数:

Yt ? ? 0 ? ?1 xt ? ? 2 xt2 ? ? 3 xt3 ? ? t
年份 1 2 3 4 5 6 7 8 总成本 Y (元) 10000 28600 19500 32900 52400 42400 62900 86300 产量 X (件) 100 300 200 400 600 500 700 900 年份 9 10 11 12 13 14 15 总成本 Y (元) 74100 100000 133900 115700 154800 178700 203100 产量 X (件) 800 1000 1200 1100 1300 1400 1500

5.ex9_5 中存放着在 20 家药品生产企业年销售收入与广告费用支出的数据。 (1) 计算销售收入和广告费用间的 Pearson 相关系数 r 为:A. 0.8661 B. 0.9306 C. 0.8587 D. -0.9306 (2) 由第(1)题计算的 Pearson 相关系数判断两者间的相关程度和相关方向为( ) A. 高度负相关 B. 中度负相关 C. 高度正相关 D. 中度正相关 (3) 假如要建立销售收入(因变量)对广告费用(自变量)的线性回归模型,求得其经验回归直线为( )

? A. y ? 274 .55 ? 5.13 x ? C. y ? ?274 .55 ? 5.13 x
(4) 检验回归系数是否为 0 即

? B. y ? ?274 .55 ? 5.13 x ? D. y ? 274 .55 ? 5.13 x
H 0 : ?1 ? 0
, 则( ) (显著性水平 ? ? 0.05 )

A. t ? 10.7887 , 回归系数 ?1 ? 0

B. t ? 10.7887 , 回归系数 ?1 ? 0

10

班级:

学号:

姓名:

统计学习题活页 2012 年版
?9 D. t ? 2.74 ? 10 , 回归系数 ?1 ? 0

?9 C. t ? 2.74 ? 10 , 回归系数 ?1 ? 0

(5)该线性回归模型的可决系数为( )A. 0.9306 B. 0.8661 C. 0.8586 D. 0.4150 6.ex9_6 保存了某地区 16 个林业局的年木材采伐量和相应伐木剩余物数据。 (1)假如要建立伐木剩余物(因变量)对年木材采伐量(自变量)的线性回归模型,求得其经验回归直线为( )

? A. y ? ?0.7629 ? 0.4043 x

? B. y ? 0.7629 ? 0.4043 x ? D. y ? 0.7629 ? 0.4043 x

? C. y ? ?0.7629 ? 0.4043 x

(2)该线性回归方程的估计标准误差是( )A.2.0363 B. 1.2210 C 0.0333 D.58.0523 (3)伐木剩余物变差中有( )是由于年木材采伐量变动引起的。 A. 58.0523 B. 608.3742 C. 666.4265 D.146.7166 (4)该线性回归方程的判定系数是( )A.-0.6249 B.12.1127 C. 146.7166 D.0.9128 (5)检验回归方程的显著性。 ) ( A. t ? 12.1127 , 回归方程显著; B. t ? 12.1127 , 回归方程不显著;

C. F ? 146 .7166 ,回归方程显著; D. F ? 146 .7166 ,回归方程不显著 7.ex9_7 中保存了美国机动车汽油消费量(QMG)及相关指标数据:汽车保有量(MOB) 、机动车汽油零 售价格(PMG) 、国民生产总值(GNP) 。 (1)以美国机动车汽油消费量为因变量,其余变量为自变量,建立回归模型为: ) ( A. QMG ? 17025279 .42 ? 1.36 MOB ? 27235486 .57 PMG ? 30106 .66GNP B. QMG ? 17025279 .42 ? 1.36 MOB ? 27235486 .57 PMG ? 30106 .66GNP C. QMG ? 17025279 .42 ? 1.36 MOB ? 27235486 .57 PMG ? 30106 .66GNP D. QMG ? ?17025279 .42 ? 1.36 MOB ? 27235486 .57 PMG ? 30106 .66GNP (2)在评价上述模型的拟合优度时,通常采用的统计量及值为( ) A.判定系数,0.9669 B. 判定系数,0.9639 C. 修正的判定系数,0.9669 D. 修正的判定系数,0.9639 (3)该回归方程的估计标准误差是( )A.4362677.69 B.2361434.87 (4)对整个回归模型的显著性进行检验(显著性水平 ? ? 0.05 ),则( A. 根据 F 统计量判断,结论是拒绝原假设,回归方程不显著 B. 根据 F 统计量判断,结论是拒绝原假设,回归方程显著 C.根据 t 统计量判断,结论是拒绝原假设,回归方程不显著 D. 根据 t 统计量判断,结论是拒绝原假设,回归方程显著 (5)对自变量 MOB 的回归系数进行检验(显著性水平 ? ? 0.05 ),则( A.F=330.6453,回归系数显著 C. ? ? 1.36 ,回归系数显著 B. R ? 0.9669 ,回归系数显著
2

C.0.19 D.9321.72



) 。

D. t=7.03, 回归系数显著

11

班级:

学号:

姓名:

统计学习题活页 2012 年版

第十二章
1.某商店四种主要商品的销售价格、销售量资料如下: 商品种类 甲 乙 丙 丁 单位 件 公斤 米 个 价格(元) 基期 10 54 26 8

指数
销售量 基期 200 100 410 600 报告期 240 88 400 640 12 68 32 8 报告期

(1)计算拉氏和派氏价格总指数 (2)计算拉氏和派氏销售量总指数

2. 已知三种商品的有关资料如下: 商品名称 甲 乙 丙 合 计 单位 张 把 件 — 销售额(万元) 基期 25 35 100 160 报告期 18 56 168 242 销售量个体指数 (%) 80 125 140 — 个体价格指数 (%) 90 128 120 —

(1) 计算三种商品的销售量总指数以及由于销售量变动而增加或减少的销售额 (2) 计算三种商品的价格总指数以及由于价格变动而增加或减少的销售额

3.根据指数之间的关系计算回答下列问题: (1)某企业 2011 年产品产量比 2010 年增长了 10%,生产费用增长了 12%,问 2011 年产品单位成本变 动如何? (2)某公司职工人数增加 8%,工资水平提高了 10%,工资总额增长多少? (3)商品销售额计划增长 10%,而销售价格却要求下降 10%,则销售量如何变化? (4)价格调整后,同样多的货币少购买商品 5%,问物价指数是多少?

4. 某国制造业工人周工资和消费物价指数资料如下: 年份 2005 2011 平均周工资(美元) 200 250 消费物价指数(2000=100) 105 110

(1)按美元面值计算,2011 年平均周工资比 2005 年增长了多少? (2)考虑物价因素,2011 年平均周工资比 2005 年增长了多少?

5.某国出口贸易价格指数如下: 年份 指数(1990=100) 年份 1995 103 2000 1996 105 2001
12

1997 105 2002

1998 104 2003

1999 108 2004

2000 112 2005

班级:

学号:

姓名:

统计学习题活页 2012 年版

指数(2000=100)

100

106

114

142

199

213

(1)以 1990 年为基期,编制 1995-2005 年的该国出口贸易价格指数数列。 (2)以 2000 年为基期,编制 1995-2005 年的该国出口贸易价格指数数列。

6. ex12_6 数据库中存放着 7 月份居民消费价格同比指数,分为全国、城市与农村三项。每个总指数是通 过综合八个类指数得到的。 (1)根据给出的权数,计算农村的“交通和通信”类指数该指数为:__________ (2)根据给出的权数,计算农村的居民消费价格指数。该指数为:__________ (3)城市“交通和通信”类指数为 97.8971,意味着( ) 。 A.在该项目上,物价上涨了 2.1029%。与去年比,购买同样的项目,支出增加。 B.在该项目上,物价上涨了 2.1029%。与去年比,购买同样的项目,支出减少。 C.在该项目上,物价下跌了 2.1029%。与去年比,购买同样的项目,支出增加。 D.在该项目上,物价下跌了 2.1029%。与去年比,购买同样的项目,支出减少。 (4)一个城市居民去年花费在“交通和通信”上是 100 元,如果维持去年的消费项目,他今年需要支付 ( ) 。A.97.90 元 B.102.1 元 C.100 元 D.98.88 元 (5)指数对比基数时间是__________A.去年 7 月 B.今年 6 月 C.去年 12 月 C.今年 1 月

7. ex12_7 中的数据库上半部分存放着各地区农业生产资料价格分类指数,下半部分存放着部分地区各类 指数的权重。总指数是通过综合十个类指数得到的。 考虑十个类指数的重要性,计算辽宁、吉林、黑龙江的总指数。 (1) 辽宁的总指数为 __________。 A.113.3946 B.113.18 C.112.18 D.111.83 (2) 吉林的总指数为 __________。 A.108.4212 B.113.18 C.112.18 D.111.83 (3) 黑龙江的总指数为 __________。 A.111.7921 B.113.18 C.112.18 D.111.83 (4) 安徽某地区的农民用 1 亿元来购买农业生产资料,根据加权指数,与全国水平相比,总体上说,他们 ( ) 。 A.多花 1 千万 B.多花 1 百万 C.少花 1 千万 D.少花 1 百万 (5) 根据加权指数,从支出角度看,江苏、浙江、安徽和福建四省农民的境况较好的是( ) 。

综合案例题
【说明】该题为选做题。如果选做本题,请将本题要求的书面报告与最后一次作业一起提交,同时提供对 应的电子文档。 如果做得好,可以在平时成绩上有一个加分。 请自己保存本题报告的副本,上交的报告
13

班级:

学号:

姓名:

统计学习题活页 2012 年版

不退还。谢谢合作! 【背景】 假定你在世纪国家银行的规划部工作,你的领导是 Lamberg 女士。最近 Lamberg 女士要你做一 些数据分析并撰写一份简明的书面报告,该报告极有可能被该银行的董事长 Selig 先生阅读,所以你要确 保报告将是全面、准确的。 世纪国家银行在美国中西部和东南部的一些城市设有支行。作为银行董事长兼 CEO 的 Selig 先生希望令望 了解,支票账户客户的主要特征。典型的支票账户客户的账户余额是多少? 支票账户客户还使用了多少 项银行的其他业务? 他们是否使用了 ATM 服务, 如果使用了, 多长时间使用一次? 借记卡的情况如何? 谁 在使用借记卡? 多长时间使用一次借记卡? 为了更好地了解这些客户, Selig 先生要求规划部经理 Lamberg 女士抽取一个客户样本, 并准备一份报告。 于是, Lamberg 女士首先从她的下属中抽调几名员工组成一个工作组,同时任命你为该工作组的组长,并 负责准备这份报告。 你抽取了的位客户组成一个随机样本。 除上个月月底他们的账户余额外, 你还确定了: (1)上个月使用 ATM 交易的次数; (2)客户使用银行其他业务(储蓄账户、存款证等)的项数; (3)客 户是否拥有借记卡(这是一项相对较新的银行业务,欠款直接从客户的账户中扣除)(4)是否用支票账 ; 户支付利息。样本包括来自俄亥俄州辛辛那提支行、佐治亚州亚特兰大支行、肯塔基州路易斯维尔支行和 宾夕法尼亚州伊利支行的客户。有关数据在“综合案例”中。 【数据库描述】 x1: 支票账户余额 x2: 上个月使用 ATM 交易的次数 x3: 客户使用银行其他业务(储蓄账户、存款证等)的项数 x4: 客户是否拥有借记卡(1-使用、0-未使用) x5: 是否用支票账户支付利息(1-用支票账户支付利息、0-不用支票账户支付利息) x6: 银行代码(俄亥俄州辛辛那提支行为 1、佐治亚州亚特兰大支行为 2、肯塔基州路易斯维尔支行为 3、 宾夕法尼亚州伊利支行为 4)

【分析要求】 1. 利用统计图表来描绘支票账户余额的情况。 典型的客户支票账户余额是多少? 是否有很多客户的账户余 额超过了 2000 美元? 4 家支行账户的分布是否存在差异? 4 家支行账户余额趋向于聚集在哪个值附近? 2. 确定支票账户余额的均值和中位数。比较 4 家支行支票账户余额的均值和中位数。4 家支行的账户余额 之间是否存在差异? 在你的报告中,一定要对均值和中位数之间的差异做出解释。 3. 确定支票账户余额的极差和标准差。第 1 四分位数和第 3 四分位数反映了哪些信息? 计算偏度系数,指 出偏度系数表明的含义。由于 Selig 先生平时很少接触统计学,你应该在报告中对标准差和其他计量进行 简要的描述和解释。 4. 建立一个使用借记卡的消费者比例的 95%的置信区间。根据这个区间,使用借记超过 50%的结论合理 吗? 请对你的结果做出解释。 5. 因为有许多可能利用的选择,顾客不会再让他们的金钱停留在一个支票账户上。多年来,平均账户余额 为 1600 美元。样本数据是否表明,平均账户余额已从 1600 美元下降。

14

班级:

学号:

姓名:

统计学习题活页 2012 年版

6. 近年来使用 ATM 的在增长。当 Selig 先生接手银行时,每位客户每月平均交易 8 次,现在他认为增加 到 10 此以上。 事实上, 准备为世纪国家银行做 TV 商务的广告代理商想要使用这种新设计的商业交易工具, 是否有足够的证据能做出结论,每位客户每月平均交易次数超过 10 次?广告代理商是否能宣称,每位客 户每月平均交易次数超过 9 次? 7. 银行在 4 个不同的城市:俄亥俄州的辛辛那提、佐治亚州的亚特兰大、肯塔基州的路易斯维尔和宾夕法 尼亚州的伊利设有分行。Selig 先生想要知道,4 家分行之间的平均支票账户余额是否存在差异? 如果存在 差异,哪些分行之间会出现差异? 8. Selig 先生还对银行的 ATM 感兴趣。分行之间 ATM 的使用情况是否存在差异? 还有,有借记卡的客户 与没有借记卡的客户使用 ATM 的倾向是否存在差异? 用支票账户支付利息的客户与没有使用支票账户支 付利息的客户在 ATM 的使用上是否存在差异? 9. 以支票账户余额为因变量,以 ATM 交易次数、其他服务使用的次数、个人是否有记账卡以及利息是否 已被特别账户支付为自变量,写出一个表明哪些变量看来与账户余额有关,以及这些变量解释了多少账户 余额中的变异性。是否应该建议,所有的自变量都要用在分析中或者可以删除若干个? 10. 分行所在地与顾客是否持有借记卡之间相关吗? 根据可以得到的信息,构造表格说明两个变量之间的 关系。在 0.05 的显著性水平下,我们能否认为,分行所在地与顾客是否持有借记卡之间是相关的。

【要求】写一份简明的书面报告。

15


相关文档

活页练习题数据
活页习题
统计学习题活页_2011
统计学习题活页答案_2009
一次函数活页经典练习题
统计学习题活页_2009
2016活页练习题
第十二单元化学与生活活页练习题
高等数学 同济2版活页习题 第十一章
高等数学 同济2版活页习题第九章
电脑版