nbhkdz.com冰点文库

高三高考数学解题错误集及析答五


高三高考数学解题错误集及析答五
12.4 线性回归方程 一、知识导学 1. 变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数 表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达 2. 能用直线方程 y ? bx ? a 近似表示的相关关系叫做线性相关关系 3. 一般地,设有(x,y)的 n 对观察数据如下:
^

/>
x
y

x1

x2
y2

x3 y3

…… ……

xn
yn

y1

当 a,b 使 Q ? ( y1 ? bx1 ? a) 2 ? ( y2 ? bx2 ? a) 2 ? ......? ( yn ? bxn ? a) 2 取得最小值时, 就称 y ? bx ? a 为拟合这 n 对数据的线性回归方程, 将该方程所表示的直线 称为回归直线. 4.线性回归方程 y ? bx ? a 中的系数 a, b 满足:
n ?? n 2 ? ?n ? ? ?? x i ? b ? ?? x i ? a ? ? x i y i i ?1 ?? i ?1 ? ? i ?1 ? ? n n ?? x ?b ? na ? ? yi ? ?? i ? i ?1 ?? i ?1 ?
? ?

由此二元一次方程组便可依次求出 b, a 的值:
n ? ? n ?? n ? n ? xi y i ? ?? xi ? ?? y i ? ? ? i ?1 ? ? i ?1 ? ?b ? i ?1 2 ? n ? n ? 2 ? n ? x i ? ?? xi ? ? i ?1 ? i ?1 ? ? ? ? ?a ? y ? b x ?

(*)

5.一般地,用回归直线进行拟合的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近; (2)如果散点在一条直线附近,用公式(*)求出 a, b ,并写出线性回归方程. 二、疑难知识导析 1.现实世界中两个变量的关系中更多的是相关关系而不是确定性关系,许多物理学中公式 看起来是确定性关系,实际上由于公式的使用范围,测量误差等的影响,试验得到的数据之 间是相关关系. 2.用最小二乘估计方法计算得到的 a, b 使函数 Q?a, b ? 达到最小

3.还有其他寻找较好的回归直线的原则(如使 y 方向的偏差和最小,使各点到回归直线的 距离之和最小等) 4. 比较相关关系绝对值的大小可以比较一组变量之间哪两个变量有更强的(线性)相关关 系. 5. “最好的”直线方程中“最好”可以有多种解释,也就有不同的求解方法,现在广泛采 用的最小二乘法所用的思想是找到使散点到直线 y ?? bx ? a 在垂直方向上的距离的平 方和最小的直线 y ? bx ? a ,用这个方法, a, b 的求解最简单 三、经典例题导讲 [例 1]有如下一组 y 与 x 的数据

x
y

-3 9

-2 4

-1 1

0 0

1 1

2 4

3 9

问 y 与 x 的(样本)相关系数 r 是多少?这是否说明 y 与 x 没有关系? 错解:

? ( xi ? x)( yi ? y) ? ? xi yi ? 7 xy ? 0 ? 7 ? 0 ? 4 ? 0
i ?1 i ?1

7

7

所以相关系数 r=0,即 y 与 x 没有关系. 错因:相关系数 r=0 并不是说明 y 与 x 没有关系,而是说明 y 与 x 没有线性相关关系,但有 可能有非线性相关关系. 正解:

? ( xi ? x)( yi ? y) ? ? xi yi ? 7 xy ? 0 ? 7 ? 0 ? 4 ? 0
i ?1 i ?1

7

7

所以相关系数 r=0,即 y 与 x 没有线性相关关系,但有可能有非线性相关关系. 此题中 y 与 x 之间存在着 y ? x 2 的二次相关关系的. [例 2]某工厂在 2004 年的各月中,一产品的月总成本 y(万元)与月产量 x(吨)之间有如 下数据: x y 4.16 4.38 4.24 4.56 4.38 4.6 4.56 4.83 4.72 4.96 4.96 5.13 5.18 5.38 5.36 5.55 5.6 5.71 5.74 5.89 5.96 6.04 6.14 6.25

若 2005 年 1 月份该产品的计划产量是 6 吨,试估计该产品 1 月份的总成本. 分析:可将此问题转化为下面三个问题: (1)画出散点图,根据散点图,大致判断月总成本 y 与月产量之间是否有线性相关关系; (2)求出月总成本 y 与月产量 x 之间的线性回归方程; (4) 若 2005 年 1 月份该产品的计划产量是 6 吨,试估计该产品 1 月份的总成本. 错解: 省去第一步, 即把判断判断月总成本 y 与月产量之间是否有线性相关关系的过程舍去, 想当然其具有线性相关关系,直接代入公式,求出线性回归方程. 错因:此题的月总成本 y 与月产量 x 之间确实是有线性相关关系,若不具有则会导致错误. 因此判断的过程不可少. 正解: (1)散点图见下面,从图中可以看到,各点大致在一条直线附近,说明 x 与 y 有较强 的线性相关关系.

(2)代入公式(*)得:a=0.9100,b=0.6477,线性回归方程是:y=0.9100x+0.6477. (3)当 x=6.0 时,y=0.9100 ? 6.0 ? 0.6477 ? 6.11 (万元) ,即该产品 1 月份的总成本的估 计值为 6.11 万元. [例 3]变量 y 与 x 有线性回归方程 y ? bx ? a , 现在将 y 的单位由 cm 变为 m, x 的单位由 ms 变为 s ,则在新的回归方程 y ? b * x ? a * 中. a ?
*

.

错解:0.1 a
n ? ? n ?? n ? n ? xi y i ? ?? xi ? ?? y i ? ? ? i ?1 ? ? i ?1 ? ?b ? i ?1 2 ? n ? n ? 错因:由 ? n? xi2 ? ?? xi ? ? i ?1 ? i ?1 ? ? ? ? ?a ? y ? b x ?

且 y 的值变为原来的 10

?2

, x 的值变为原

来的 10 可得 a 的值应为原来的 10 . 正解:0.01 a [例 4]假定一个物体由不同的高度落下,并测量它落下的时间,几个测量结果如下表所示: 高 度 s(cm) 时 间 t(ms) 40 353 60 387 100 505 130 552 150 579 180 648 200 659 220 700 240 725

?3

*

?2

高度(距离)与时间之间的关系由公式 s ?

1 2 gt 给出,这里 g 是重力加速度的值. 2

(1)画出 s 关于 t 的散点图,这些点在一条直线附近吗? (2)设 x ? t ,画出 s 关于 x 的散点图,这些点在一条直线附近吗?
2

(3)求出 s 关于 x 的线性回归方程. 解: (1)高度 s 关于时间 t 的散点图见下面,从图中可以看到这些点似乎在一条直线附近, 也好像在一条抛物线附近

(2)高度 s 关于 x 的散点图见下面,从图中可以看到这些散点大致在一条直线附近

(3)可以求得 s 关于 x 的线性回归方程是 s=0.0004901x-18.8458 [例 5]测得某国 10 对父子身高(单位:英寸)如下: 父 亲 60 身 高 (x) 儿 子 63.5 身 高 (y) 62 64 65 66 67 68 70 72 74

65.2

66

65.5

66.9

67.1

67.4

68.3

70.1

70

(1)画出散点图; (2)求出 y 与 x 之间的线性回归方程; (3)如果父亲的身高为 73 英寸,估计儿子的身高. 解: (1)散点图见下面:

(2)从散点图可以看出,这些点都分布在一条直线附近,可求得线性回归方程为

y ? 0.4645x ? 35.98
(3)当 x ? 73 时, y ? 0.4645? 73 ? 35.98 ? 69.9 所以当父亲的身高为 73 英寸时,估计儿子的身高约为 69.9 英寸. 四、典型习题导练 1.回归直线方程的系数 a,b 的最小二乘估计使函数 Q (a, b) 最小, Q 函数指( ).
?

?

A.

?(y
i ?1

n

2 i

? a ? bxi )

B.

?y
i ?1

n

i

? a ? bxi

C. ( yi ? a ? bxi ) 2

D. yi ? a ? bxi

2. “回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,高尔顿提出的,他的 研究结果是子代的平均身高向中心回归.根据他的结论在儿子的身高 y 与父亲的身高 x 的线 性回归方程 y ? a ? bx 中,b( ). A.在(-1,0)内 B.等于 0 C.在(0,1)内 D.在[1,+∞]内 3.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得到观测结果如 下: 温度 x 溶解度 y 0 66.7 10 76.0 20 85.0 50 112.3 70 128.0
?

则由此得到的回归直线的斜率是 (保留 4 位有效数字) 4.下面的数据是年龄在 40 至 60 岁的男子中随机抽取的 6 个样本,分别测定了心脏功能水 平 y(满分 100) ,以及每天画在看电视上的平均时间 x(小时) 看电视平 均时间 x 心脏功能 水平 y 4.4 52 4.6 53 2.7 69 5.8 57 0.2 89 4.6 65

则 x 与 y 的样本相关系数为 . 5. 某地区近年来冬季的降雨量 x(cm)与次年夏季空气中碳氢化合物的最高平均浓度 (ppm) y , 的观测数据如下表: 年 198 份 8 n x y 28 4.5 22 4.1 31 4.8 23 4.2 58 4.6 33 3.6 21 3.1 20 2.8 45 3.4 31 2.6 23 2.3 16 2.2 14 2.0 198 9 199 0 199 1 199 2 199 3 199 4 199 5 199 6 199 7 199 8 199 9 200 0

你认为 y 与 x 是什么关系?y 与 n 是什么关系? 6.每立方米混凝土的水泥用量 x(单位:kg)与 28 天后混凝土的托压强度(单位:kg/cm ) 的关系有如下数据: x Y 150 56.9 160 58.3 170 61.6 180 64.6 190 68.1 200 71.3 210 74.1 220 77.4 230 80.2 240 82.6 250 86.4 260 89.7
2

(1)y 与 x 是否具有线性相关关系? (2)如果 y 与 x 具有线性相关关系,求线性回归方程.


高三高考数学解题错误集及析答五

高三高考数学解题错误集及析答五 12.4 线性回归方程 一、知识导学 1. 变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数 表示;一类...

高三高考数学解题错误集及析答一

6页 5财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答一 高三高考数学高三高考数学高...

高三高考数学解题错误集及析答四

6页 5财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答四 高三高考数学高三高考数学高...

高三高考数学解题错误集及析答六

如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答六 高三高考数学高三高考数学高三高考数学...

高三高考数学解题错误集及析答三

6页 5财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答三 高三高考数学高三高考数学高...

高三高考数学解题错误集及析答

6页 5财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答 高三高考数学高三高考数学高三...

高三高考数学解题错误集及析答二

如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 高三高考数学解题错误集及析答二 高三高考数学高三高考数学高三高考数学...

高考数学复习点拨:集合解题错误剖析

高考数学复习点拨:集合解题错误剖析 福建省厦门外国语...集合问题中常见的错误进行剖 . 一、忽视空集的...5 时, N 中的元素为 0,7,3,7,这集合中...

高考数学解题错误成因分析与应对策略

高考数学解题错误成因分析与应对策略_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 高考数学解题错误成因分析与应对策略_数学_高中教育_教育专区。...

高考数学解题错误成因分析与应对策略

高考数学解题错误成因分析与应对策略_数学_高中教育_教育专区。高考数学解题非智力因素失误的成因分析与应对策略 高考数学解题非智力因素失误的成因分析与应对策略高考是...