nbhkdz.com冰点文库

变量间的相关关系


学案 58

变量间的相关关系

导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关 关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.

自主梳理 1.两个变量的线性相关 (1)正相关 在散点图中, 点散布在从__________到________的区域, 对

于两个变量的这种相关关系, 我们将它称为正相关. (2)负相关 在散点图中, 点散布在从________到________的区域, 两个变量的这种相关关系称为负 相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近, 我们就称这两个变量之间具有 线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法 求回归直线使得样本数据的点到它的 ________________________的方法叫做最小二乘 法. (2)回归方程
^ ^ ^

方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,
^ ^

yn)的回归方程,其中a,b是待定参数.

自我检测 1.下列有关线性回归的说法,不正确的是( ) A.相关关系的两个变量不一定是因果关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.任一组数据都有回归直线方程 2.(2009· 海南,宁夏)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点图(1); 对变量 u, v 有观测数据(ui, vi)(i=1,2, …, 10), 得散点图(2). 由这两个散点图可以判断( )

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 3.(2011· 银川模拟)下表是某厂 1~4 月份用水量(单位:百吨)的一组数据:

月份 x 用水量 y
^ ^

1 4.5

2 4

3 3

4 2.5
^

由散点图可知,用水量 y 与月份 x 之间有较好的线性相关关系,其回归直线方程是y= -0.7x+a,则a等于( ) A.10.5 B.5.15 C.5.2 D.5.25 4. (2010· 广东)某市居民 2005~2009 年家庭年平均收入 x(单位: 万元)与年平均支出 Y(单 位:万元)的统计资料如下表所示: 2005 2006 2007 2008 2009 年份 11.5 12.1 13 13.3 15 收入 x 6.8 8.8 9.8 10 12 支出 Y 根据统计资料, 居民家庭年平均收入的中位数是_________________________________, 家庭年平均收入与年平均支出有______线性相关关系. 5.(2011· 金陵中学模拟)已知三点(3,10),(7,20),(11,24)的横坐标 x 与纵坐标 y 具有线 性关系,则其回归方程是________________.

探究点一 利用散点图判断两个变量的相关性 例 1 有一位同学家开了一个小卖部, 他为了研究气温对热饮销售的影响, 经过统计, 得到一个卖出热饮杯数与当天气温的对比表:

温度 0 4 7 12 15 19 23 27 31 36 -5 (℃) 热饮 156 150 132 128 130 116 104 89 93 76 54 杯数 (1)画出散点图; (2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?

变式迁移 1 某班 5 个学生的数学和物理成绩如表: 学生 A B 学科 80 75 数学 70 66 物理 画出散点图,并判断它们是否有相关关系? C 70 68 D 65 64 E 60 62

探究点二 求回归直线方程 例 2 假设关于某设备的使用年限 x 和所支出的维修费用 y(万元)有以下统计资料: 使用年限 x 维修费用 y 2 2.2 3 3.8 4 5.5
^

5 6.5
^ ^

6 7.0

若由资料知 y 对 x 呈线性相关关系.试求回归方程y=bx+a.

变式迁移 2 已知变量 x 与变量 y 有下列对应数据: 1 2 3 4 1 3 y 2 3 2 2 且 y 对 x 呈线性相关关系,求 y 对 x 的回归直线方程. x

探究点三 利用回归方程对总体进行估计 例 3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应 的生产能耗 y(吨标准煤)的几组对照数据. x y (1)请画出上表数据的散点图; 3 2.5 4 3 5 4 6 4.5
^ ^ ^

(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归方程y=bx+a; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤. 试根据(2)求出的回归方程, 预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)

变式迁移 3 (2011· 盐城期末)某单位为了了解用电量 y 度与气温 x℃之间的关系,随机 统计了某 4 天的用电量与当天气温,并制作了对照表: 气温(℃) 用电量(度)
^ ^ ^

18 24
^

13 34

10 38

-1 64

由表中数据得回归方程y=bx+a中b=-2,预测当气温为-4℃时,用电量的度数约为 ________. 1.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.而相关关 系是一种非确定性关系, 即相关关系是非随机变量与随机变量之间的关系. 函数关系是 一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 2.回归直线方程:设 x 与 y 是具有相关关系的两个变量,且相应于 n 个观测值的 n 个 点大致分布在某一条直线的附近,就可以认为 y 对 x 的回归函数的类型为直线型:

^

^

^

y=bx+a.其中 1n 1n 我们称这个方程为 y 对 x 的回归直线方程.其中 x = ∑ x , y = ∑y ,( x , y )称 i ni=1 ni=1 i 为样本点的中心. 3.求回归直线方程的步骤:(1)计算出 x 、 y 、∑ x2 xiyi 的值;(2)计算回归系数a、 i 、∑ = =
^ ^ ^ ^ i 1 i 1 n n ^

b;(3)写出回归直线方程y=bx+a.

(满分:75 分) 一、选择题(每小题 5 分,共 25 分) 1.下列命题: ①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
^ ^ ^ ^

③通过回归直线y=bx+a及回归系数b,可以估计和预测变量的取值和变化趋势. 其中正确的命题是( ) A.①② B.①③ C.②③ D.①②③
^

2.设有一个回归直线方程为y=2-1.5x,则变量 x 增加一个单位时( A.y 平均增加 1.5 个单位 B.y 平均增加 2 个单位 C.y 平均减少 1.5 个单位 D.y 平均减少 2 个单位

)

3.(2011· 陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l

是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( A.x 和 y 的相关系数为直线 l 的斜率 B.x 和 y 的相关系数在 0 到 1 之间 C.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 D.直线 l 过点( x , y ) 4.(2011· 山东)某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元) 销售额 y(万元)
^ ^ ^

)

4 49
^

2 26

3 39

5 54

根据上表可得线性回归方程y=bx+a中的b为 9.4, 据此模型预报广告费用为 6 万元时销 售额为( ) A.63.6 万元 B.65.5 万元 C.67.7 万元 D.72.0 万元 5.(2011· 青岛模拟)为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两位同学各自 独立做了 10 次和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1、l2,已知两 人所得的试验数据中,变量 x 和 y 的数据的平均值都相等,且分别是 s、t,那么下列说法中 正确的是( ) A.直线 l1 和 l2 一定有公共点(s,t) B.直线 l1 和 l2 相交,但交点不一定是(s,t) C.必有 l1∥l2 D.l1 与 l2 必定重合 二、填空题(每小题 4 分,共 12 分) 6.下列关系中,是相关关系的为________.(填序号) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 7.已知回归直线的斜率的估计值是 0.73,样本点的中心为(12.5,8.25),则回归直线的回 归方程是______________. 8. (2011· 茂名月考)在研究硝酸钠的可溶性程度时, 观测它在不同温度的水中的溶解度, 得观测结果如下表: 0 10 20 50 70 温度(x) 66.7 76.0 85.0 112.3 128.0 溶解度(y) 则由此得到回归直线的斜率为________. 三、解答题(共 38 分) 9. (12 分)(2011· 威海模拟)某车间为了规定工时定额, 需要确定加工零件所花费的时间, 为此做了四次试验,得到的数据如下: 2 零件的个数 x(个) 2.5 加工的时间 y(小时) (1)在给定的坐标系中画出表中数据的散点图; 3 3 4 4 5 4.5

^

^

^

(2)求出 y 关于 x 的回归方程y=bx+a,并在坐标系中画出回归直线; (3)试预测加工 10 个零件需要多少时间?

n ^

(注:b=

i 1

∑ xiyi-n x =
i=1

y
2

^

^

∑xi2-n x

n

,a= y -b x )

10.(12 分)(2010· 许昌模拟)某种产品的宣传费支出 x 与销售额 y(单位:万元)之间有如 下对应数据: x y 2 30 4 40 5 60 6 50 8 70

(1)画出散点图; (2)求回归直线方程; (3)试预测宣传费支出为 10 万元时,销售额多大?

11.(14 分)某企业上半年产品产量与单位成本资料如下: 月份 产量(千件) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 (1)求出回归方程; (2)指出产量每增加 1 000 件时,单位成本平均变动多少? (3)假定产量为 6 000 件时,单位成本为多少元?

学案 58
∑ ?xi- x ??yi- y ? ∑ xiyi-n x =
i=1 n

变量间的相关关系
右下角 2.(1) 距 离 的 平 方 和 最 小

自主梳理 1 . (1) 左 下 角
n

右上角
n i 1 n

(2) 左 上 角 y
2

(2)

i=1

∑ ?xi- x ?2
^

i=1

∑ x2 i -n x

y -b x

自我检测 1.D 2.C 3.D
^ 7 23 4.13 正 5.y= x+ 4 4 课堂活动区 例 1 解题导引 判断变量间是否线性相关,一种常用的简便可行的方法就是作散点 图. 散点图是由大量数据点分布构成的, 是定义在具有相关关系的两个变量基础之上的, 对 于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度. 解 (1)以 x 轴表示温度,以 y 轴表示热饮杯数,可作散点图,如图所示.

(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售 杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少. 从散点图可以看出,这些点大致分布在一条直线附近. 变式迁移 1 解 以 x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下图 所示:

由散点图可见,两者之间具有相关关系. 例 2 解题导引 根据题目给出的数据,利用公式求回归系数,然后获得回归方程. 解 制表如下: i xi yi xiyi x2 i
^

1 2 2.2 4.4 4

2 3 3.8 11.4 9

3 4 5.5 22.0 16
5 i 1

4 5 6.5 32.5 25

5

5 6 7.0 42.0 36

合计 20 25 112.3 90

x =4; y =5; ∑ x2i=90;∑ xiyi=112.3 = =
i 1

112.3-5×4×5 12.3 于是有b= = =1.23; 10 90-5×42
^ ^ ^

a= y -b x =5-1.23×4=0.08. ∴回归直线方程为y=1.23x+0.08. 1+2+3+4 5 变式迁移 2 解 x = = , 4 2 1 3 + +2+3 2 2 7 y= = , 4 4

i 1 n

2 2 2 2 ∑ x2 i =1 +2 +3 +4 =30, =

n

1 3 43 ∑ xiyi=1× +2× +3×2+4×3= , = 2 2 2 i 1 n 43 5 7 -4× × ∑xiyi-n x y ^ 2 2 4 i=1 ∴b= n = =0.8, 25 2 2 ∑ x - n x 30 - 4 × i i=1 4 ^ ^ 7 5 a= y -b x = -0.8× =-0.25, 4 2
^

∴y=0.8x-0.25. 例 3 解题导引 利用描点法得到散点图,按求回归方程的步骤和公式,写出回归方 程,最后对总体进行估计. 利用回归方程可以进行预测, 回归方程将部分观测值所反映的规律进行延伸, 是我们对 有线性相关关系的两个变量进行分析和控制, 依据自变量的取值估计和预报因变量值的基础 和依据,有广泛的应用. 解 (1)散点图:

(2) x =
4 i 1 4 i=1

3+4+5+6 2.5+3+4+4.5 =4.5, y = =3.5, 4 4

∑ xiyi=3×2.5+4×3+5×4+6×4.5=66.5. =
2 2 2 2 ∑x2 i =3 +4 +5 +6 =86, 4 ^ i 1

∴b= =
^

∑ xiyi-4 x =
i=1

y
2

∑x2 i -4 x

4

66.5-4×4.5×3.5 =0.7, 86-4×4.52
^ ^

a= y -b x =3.5-0.7×4.5=0.35. ∴所求的回归方程为y=0.7x+0.35. (3)现在生产 100 吨甲产品用煤
^

y=0.7×100+0.35=70.35, ∴降低 90-70.35=19.65(吨标准煤). 变式迁移 3 68 解析
^

x =10, y =40,回归方程过点( x , y ),
^ ^

∴40=-2×10+a.∴a=60. ∴y=-2x+60.
^

令 x=-4,y=(-2)×(-4)+60=68. 课后练习区 1.D [根据线性回归的含义、方法、作用分析这三个命题都是正确的.] 2.C [设(x1,y1),(x2,y2)在直线上,若 x2=x1+1,则 y2-y1=(2-1.5x2)-(2-1.5x1)=

1.5(x1-x2)=-1.5,y 平均减少 1.5 个单位.] 3.D [因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越 接近 1,两个变量的线性相关程度越强,所以 A、B 错误.C 中 n 为偶数时,分布在 l 两侧 的样本点的个数可以不相同,所以 C 错误.根据线性回归方程一定经过样本中心点可知 D 正确.所以选 D.] 4+2+3+5 7 49+26+39+54 4.B [∵ x = = ,y= =42, 4 2 4 ^ ^ ^ ^ ^ 7 又y=bx+a必过( x , y ),∴42= ×9.4+a,∴a=9.1. 2
^

∴线性回归方程为y=9.4x+9.1.
^

∴当 x=6 时,y=9.4×6+9.1=65.5(万元).]
^ ^ ^ ^ ^

5.A [回归直线方程为y=bx+a.而a= y -b x ,
^ ^ ^ ^

即a=t-bs,t=bs+a.∴(s,t)在回归直线上. ∴直线 l1 和 l2 一定有公共点(s,t).] 6.①② 解析 ①中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关 系.②教师的执教水平与学生的学习成绩之间的关系是相关关系.③④都不具备相关关系.
^

7.y=0.73x-0.875
^ ^

解析 a= y -b x =8.25-0.73×12.5=-0.875. 8.0.880 9 解析
5 i 1

x =30, y =93.6,
5 i 1

∑ x2 xiyi=17 035, i =7 900,∑ = =
5 ^

∴回归直线的斜率为 b=
i 1

∑ xiyi-5 x =
i=1

y
2

∑x2 i -5 x

5

17 035-5×30×93.6 = ≈0.880 9. 7 900-4 500

9.解

(1)散点图如图所示.(4 分)
4

(2)由表中数据得∑ xiyi=52.5, =
i 1

x =3.5, y =3.5,∑ x2 i =54, =
^ ^ ^ i 1 ^

4

∴b=0.7.∴a= y -b x =1.05. ∴y=0.7x+1.05.回归直线如图中所示.(10 分) (3)将 x=10 代入回归直线方程, 得 y=0.7×10+1.05=8.05(小时), ∴预测加工 10 个零件需要 8.05 小时.(12 分) 10.解 (1)根据表中所列数据可得散点图如图所示:

(4 分) (2)计算得: x =
5 5 i 1 i 1 5

25 250 =5, y = =50, 5 5

∑ x2 xiyi=1 380. i =145,∑ = =
^ i=1

于是可得b=
^ ^

∑xiyi-5 x
i=1

y
2

∑x2 i -5 x

5

1 380-5×5×50 = =6.5, 145-5×52

a= y -b x =50-6.5×5=17.5,
^

因此,所求回归直线方程是y=6.5x+17.5.(10 分)

^

(3)由上面求得的回归直线方程可知,当宣传费支出为 10 万元时,y=6.5×10+17.5= 82.5(万元), 即这种产品的销售大约为 82.5 万元.(12 分)
6 6

11.解
6

i 1 6 2 ∑xi =79,∑ xiyi=1 481, i=1 i=1 6 ^

(1)n=6,∑ xi=21,∑ yi=426, x =3.5, y =71, = =
i 1

b=

i=1

∑xiyi-6 x
i=1

y
2

∑x2 i -6 x
^ ^

6

1 481-6×3.5×71 = ≈-1.82. 79-6×3.52

(3 分)
^

a= y -b x =71+1.82×3.5=77.37.(5 分)
^ ^ ^

∴回归方程为y=a+bx=77.37-1.82x.(6 分) (2)因为单位成本平均变动b=-1.82<0,且产量 x 的计量单位是千件,所以根据回归系 数 b 的意义有: 产量每增加一个单位即 1 000 件时,单位成本平均减少 1.82 元.(10 分) (3)当产量为 6 000 件时,即 x=6,代入回归方程:
^

y=77.37-1.82×6=66.45(元). ∴当产量为 6 000 件时,单位成本为 66.45 元. (14 分)


变量间的相关关系讲义

变量间的相关关系讲义一、基础知识梳理知识点 1:变量之间的相关关系 两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因...

2.3.1变量间的相关关系教案

2.3.1变量间的相关关系教案_高二数学_数学_高中教育_教育专区。(人教A版•必修3)2.3.1变量间的相关关系教案2.3.1 变量间的相关关系 教学目标 1、知...

_变量间的相关关系练习题

变量间的相关关系练习题一、选择题 1、下列两个变量具有相关关系的是( B )。 A. 正方体的体积与边长 B. 人的身高与体重 C. 匀速行驶车辆的行驶距离与时间 ...

变量之间的相关关系

变量间的相关关系”中的核心概念和思想方法解读及教学建议 河北师范大学数学与信息科学学院 程海奎《变量间的相关关系》的主要内容为采用定性和定量相结合的方法...

2.3 变量间的相关关系知识点试题及答案

2.3 变量间的相关关系知识点试题及答案_数学_高中教育_教育专区。一、知识要点及方法 1、概念:(1)回归直线方程: y ? a ? b x (2)回归系数: b ? ? ?...

变量间的相关关系(导学案)

4、下列选项中,两个变量具有负相关关系的是( A、 父母的身高与子女的身高 ) B、球的体积与半径之间的关系 C、汽车的重量与汽车每消耗 1L 汽油所行驶的平均...

知识讲解_变量间的相关关系_基础

掌握对两个变量进行线性回归的方法和步骤, 并能借助科学计算器确定实际问题中两个变量间的回归 直线方程; 【要点梳理】 【高清课堂:变量的相关关系 400458 知识...

变量间的相关关系与线性回归方程

变量间的相关关系与线性回归方程 变量间的相关关系与线性回归方程 一、知识点 1.正相关 从散点图看 点散布在从左下角到右上角的 正相关:从散点图看 正相关...

变量间的相关关系

变量间的相关关系限时训练一、选择题 1.(袁文典)频率分布直方图中最高小矩形的中点位置所对的数字特征是 A.中位数 B.众数 C.平均数 D.标准差 2. (李社红...