2018年高中数学人教版选修2-3课件:3.1回归分析的基本思想及其初步应用_图文

高二数学 选修2-3 3.1回归分析的基本思想及 其初步应用 比《数学3》中“回归”增加的内容 数学3——统计 5. 1. 画散点图 2. 了解最小二乘法的思想 3. 求回归直线方程 y=bx+a 6. 7. 8. 选修2-3——统计案例 引入线性回归模型 y=bx+a+e 了解模型中随机误差项e产生的原因 了解相关指数 R2 和模型拟合的效果 之间的关系 了解残差图的作用 4. 用回归直线方程解决应用 问题 9. 利用线性回归模型解决一类非线性回 归问题 10. 正确理解分析方法与结果 回归分析的内容与步骤: 回归分析通过一个变量或一些变量的变化解释另 一变量的变化。 其主要内容和步骤是: 首先根据理论和对问题的分析判断,将变量分为自变量和因变 量; 其次,设法找出合适的数学方程式(即回归模型)描述变量间 的关系; 由于涉及到的变量具有不确定性,接着还要对回归模型进行 统计检验; 统计检验通过后,最后是利用回归模型,根据自变量去估计、 预测因变量。 案例1:女大学生的身高与体重 例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。 1 2 3 4 5 6 7 8 编号 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。 分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量. 1. 散点图; 2.回归方程: ? ? 0.849x ? 85.172 y 身高172cm女大学生体重 ? = 0.849×172 - 85.712 = 60.316(kg) y 本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关 系,从而也表明我们建立的回归模型是有意义的。 探究: 身高为172cm的女大学生的体重一定是60.316kg吗? 如果不是,你能解析一下原因吗? 答:身高为172cm的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重接近于 60.316kg。 即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。 案例1:女大学生的身高与体重 例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。 1 2 3 4 5 6 7 8 编号 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。 3、从散点图还看到,样本点散布在 某一条直线的附近,而不是在一条 直线上,所以不能用一次函数 y=bx+a描述它们关系。 我们可以用下面的线性回归模型来表示: y=bx+a+e, (3) ? y=bx+a+e, E(e)=0,D(e)= 2 (4) 在线性回归模型(4)中,随机误差e的方差 ? 越小,通过 回归直线 (5) 预报真实值y的精度越高。随机误差是引起预报值 与真实值 y之间的误差的原因之一,其大小取决于随机误差的方差。 其中a和b为模型的未知参数,e称为随机误差。 ?为截距和斜率的估计值, ? 和b 另一方面,由于公式(1)和(2)中a 它们与真实值a和b之间也存在误差,这种误差是引起预报值与 真实值y之间误差的另一个原因。 ? y 思考: 产生随机误差项e的原因是什么? 随机误差e的来源(可以推广到一般): 1、忽略了其它因素的影响:影响身高 y 的因素不只 是体重 x,可能还包括遗传基因、饮食习惯、生 长环境等因素; 2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。 以上三项误差越小,说明我们的回归模型的拟合 效果越好。 函数模型与回归模型之间的差别 中国GDP散点图 120000 100000 80000 GDP 60000 40000 20000 0 1992 1993 1994 1995 1996 1997 年 1998 1999 2000 2001 2002 2003 函数模型: y ? bx ? a 回归模型: y ? bx ? a ? e 可以提供 选择模型的准则 函数模型与回归模型之间的差别 函数模型: y ? bx ? a 回归模型: y ? bx ? a ? e 线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和 随机误差项e共同确定,即自变量x只能解析部分y的变化。 在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。 所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为 ? y ? 0.849 ? 72 ? 85.712 ? 60.316(kg ) 对回归模型进行统计检验 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相 同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。 编号 身高/cm 体重/kg 1 165 54.5 2 165 54.5 3 157 54.5 4 170 54.5 5 175 54.5 6 165 54.5 7 155 54.5 8 170 54.5 54.5kg 在散点图中,所有的点应该落在

相关文档

2018年高中数学人教版选修2-3课件:3.1 回归分析的基本思想及其初步应用
2018年高中数学北师大版选修2-3课件:3.1 回归分析的基本思想及其初步应用(第二课时)
2018年高中数学北师大版选修2-3课件:3.1 回归分析的基本思想及其初步应用(第一课时)
2017-2018学年高中数学人教版选修2-3课件:3.1回归分析的基本思想及其初步应用 (共90张PPT)
人教版高中数学选修2-3课件:3.1.2回归分析的基本思想及其初步应用(2)
高中数学(人教版)选修2-3教学课件:3.1《回归分析的基本思想及其初步应用》课件
高中数学选修3.1回归分析的基本思想及其初步应用2人教版ppt课件
高中数学选修3.1回归分析的基本思想及其初步应用 (2)人教版ppt课件
人教版高中数学选修2-3 3.1回归分析的基本思想及其初步应用(三)教学课件 (共25张PPT)
高中数学(人教版选修2-3)同步教学课件:第三章 3-1 回归分析的基本思想及其初步应用
电脑版