nbhkdz.com冰点文库

【课堂新坐标】2016-2017学年高中数学苏教版选修1-2课件:章末分层突破01

时间:2017-07-21


巩 固 层

拓 展 层

章末分层突破
提 升 层 章 末 综 合 测 评

[自我校对] n?ad-bc?2 ① ?a+b??c+d??a+c??b+d? ②3.841 ③6.635

线性回归直线方程

^=b ^x+^ ^代表 x 每增加一个单位,y 平均增加的单位 在回归直线方程y a中,b ^>0 时,说明两个变量呈正相关关系,它的意义是: 数.一般来说,当回归系数b ^个单位;当回归系数b ^<0 时,说明两个变 当 x 每增加一个单位时,y 就平均增加b ^|个单位. 量呈负相关关系,它的意义是:当 x 每增加一个单位时,y 就平均减少|b

某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 需求量(万吨) 2006 2008 2010 2012 2014 236 246 257 276 286

^=b ^x+^ (1)利用所给数据求年需求量与年份之间的回归直线方程y a; (2)利用(1)中所求出的直线方程预测该地 2016 年的粮食需求量.

【精彩点拨】 确性.

正确利用求回归直线方程的步骤求解,注意数据计算的准

【规范解答】

(1)由所给数据看出,把年份看作点的横坐标,对应的需求

量看作点的纵坐标,画出散点图草图(图略),通过观察知这些点大致分布在一条 直线附近,下面求回归直线方程,为此对数据预处理如下: 年份—2010 需求量—257 -4 -21 -2 -11 0 2 4

0 19 29

对预处理后的数据,容易算得 x =0, y =3.2,

?-4?×?-21?+?-2?×?-11?+2×19+4×29-5×0×3.2 ^ b= ?-4?2+?-2?2+22+42-5×02 260 = 40 =6.5, ^ ^ x - =3.2, a= y -b 由上述计算结果,知所求回归直线方程为 ^-257=b ^(x-2010)+^ y a=6.5(x-2010)+3.2, ^=6.5(x-2010)+260.2. 即y (*)

(2)利用直线方程(*),可预测 2016 年的粮食需求量为 6.5×(2016-2010)+ 260.2=6.5×6+260.2=299.2(万吨).

[再练一题] 1.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四 次试验,得到的数据如下: 零件的个数 x(个) 2 3 4 5

加工的时间 y(小时) 2.5 3 4 4.5

(1)在给定的坐标系中画出表中数据的散点图;

图 11 ^=b ^ x+ ^ (2)求出 y 关于 x 的线性回归方程y a,并在坐标系中画出回归直线;

(3)试预测加工 10 个零件需要多少小时? -y ?xiyi-nx ^= (注:b
i=1 n

-2 n x ? x2 i
i=1

n

- -b ^x -) ,^ a=y

【解】 (1)散点图如图.

(2)由表中数据得: ?xiyi=52.5,
i=1

4

- =3.5,y - =3.5, ?x2=54, x i
i=1

4

^=0.7,∴^ ∴b a=1.05, ^=0.7x+1.05,回归直线如图所示. ∴y

(3)将 x=10 代入线性回归方程, ^=0.7×10+1.05=8.05, 得y 故预测加工 10 个零件约需要 8.05 小时.

回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其 步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函 数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进 行分析;有时回归模型可能会有多种选择(如非线性回归模型),此时可通过残差 分析或利用相关系数 r 来检查模型的拟合效果,从而得到最佳模型.

炼钢是一个氧化降碳的过程, 钢水含碳量的多少直接影响冶炼时间 的长短,必须掌握钢水含碳量和冶炼时间的关系,如果已测得炉料熔化完毕时 钢水的含碳量 x 与冶炼时间 y(从炉料熔化完毕到出钢的时间)的一列数据,如下 表所示: x(0.01%) 104 180 190 177 147 134 150 191 204 121 y/min 100 200 210 185 155 135 170 205 235 125

(1)y 与 x 是否具有线性相关关系? (2)如果 y 与 x 具有线性相关关系,求回归直线方程. (3)预测当钢水含碳量为 160 个 0.01%时,应冶炼多少分钟?

- ,y - ,求^ ^,写出y ^ =^ ^ x. 【精彩点拨】 列表求 r,进行判断,利用x a,b a+b

【规范解答】 i xi yi xi yi i xi yi xi yi

(1)列出下表: 1 104 100 2 180 200 36 000 7 150 170 25 500 3 190 210 39 900 8 191 205 39 155 4 177 185 32 745 9 204 235 47 940 5 147 155 22 785 10 121 125 15 125

10 400 6 134 135 18 090

10 10 10 2 2 x=159.8,y=172,∑ xi =265 448,∑ yi =312 350,∑ xiyi=287 640 i =1 i=1 i=1

于是 r=

≈0.9906. 10 2 2 2 2 ?∑ xi -10?x? ??∑ yi -10?y? ? i=1 i =1
10

- y ∑ x y -10 x i i i=1

10

根据小概率 0.05 与 n-2=8 在附表中查得 r0.05=0.632,由|r|>r0.05 知,有 95% 的把握认为 y 与 x 具有线性相关关系.

^=^ ^ x, (2)设所求回归直线方程为y a+b ^= b - y ∑ x y -10 x i i i=1
2 - ?2 ∑ x -10 ? x i i=1 10 10

≈1.267,

^ - -b ^x - ≈-30.47, a=y ^=1.267x-30.47. 即所求线性回归直线方程为y ^=1.267×160-30.47=172.25(分钟),即大约冶炼 172.25 (3)当 x=160 时,y 分钟.

[再练一题] 测得某国 10 对父子身高(单位:英寸)如下: 父亲身高(x) 60 62 64 66 70 65 66

儿子身高(y) 63.6 65.2 父亲身高(x) 67 68

65.5 66.9 72 74 70

儿子身高(y) 67.1 67.4 68.3 70.1 (1)画出散点图;

(2)如果 y 与 x 之间具有线性相关关系,求回归方程; (3)如果父亲的身高为 73 英寸,估计儿子的身高.

【精彩点拨】 第(2)问中,需先根据散点图确定 y 与 x 是否线性相关,相 关的话再利用公式求出回归方程进行回归分析.

【规范解答】

(1)

(2)从散点图看出,样本点散布在一条直线附近,因此两个变量呈线性相关 关系. ^=b ^x+^ 设回归方程为y a. - =66.8,y - =67.01, x
10 2 2 2 x =4 462.24,y ≈4 490.34,∑ x i=44 794, i=1 2 ∑ y i =44 i=1 10

941.93,∑ xiyi=44 842.4, i=1

10

^= 由b

- y ∑ x y -10 x i i i=1

10

44 842.4-44 762.68 79.72 = 44 794-44 622.4 =171.6≈0.464 6. 10 2 2 ∑ xi -10 ?x? i=1

^ - -b ^x - =67.01-0.464 6×66.8≈35.97. a=y ^=0.464 6x+35.97. 故所求的回归方程为y ^=0.464 6×73+35.97≈69.9. (3)当 x=73 时,y 所以当父亲身高为 73 英寸时,估计儿子的身高约为 69.9 英寸.

独立性检验
独立性检验是判断两个分类变量之间是否有关系的一种方法 .在判断两个分 类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否 有关系,而独立性检验可以精确地得到可靠的结论. 独立性检验的一般步骤: (1)根据样本数据制成 2×2 列联表; (2)根据公式计算 χ2; (3)比较 χ2 与临界值的大小关系作统计推断.

某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法, 从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年 龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的 日平均生产件数分成 5 组:[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分别加 以统计,得到如图 12 所示的频率分布直方图.

25 周岁以上组

25 周岁以下组 图 12

规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完 成 2×2 列联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组 有关”? P(χ2≥k) 0.100 0.050 0.010 k
2 n ? ad bc ? 附:χ2= ?a+b??c+d??a+c??b+d?

0.001

2.706 3.841 6.635 10.828

【精彩点拨】 列 2×2 列表示→计算 χ2→判断.

【规范解答】

由频率分布直方图可知,在抽取的 100 名工人中,“25 周

岁以上组”中的生产能手 60×0.25=15(人),“25 周岁以下组”中的生产能手 40×0.375=15(人),据此可得 2×2 列联表如下: 生产能手 非生产能手 合计 25 周岁以上组 25 周岁以下组 合计 15 15 30 45 25 70 60 40 100

2 n ? ad bc ? 所以得 χ2= ?a+b??c+d??a+c??b+d?

100×?15×25-15×45?2 25 = =14≈1.79. 60×40×30×70 因为 1.79<2.706, 所以没有 90%的把握认为“生产能手与工人所在的年龄组有关”.

[再练一题] 3.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据 如下表所示: 种子灭菌 种子未灭菌 合计 黑穗病 无黑穗病 合计 214 451 665 175 597 772 389 1 048 1 437

能否在犯错误的概率不超过 0.001 的前提下认为种子灭菌与小麦黑穗病有 关系? 【导学号:97220007】

【解】 提出假设 H0:假设种子灭菌与黑穗病没有关系.根据列联表中的数 据知, a=214,b=175,c=451,d=597,a+b=389,c+d=1 048,a+c=665, b+d=772,n=1 437, 代入公式求得
2 1 437×?214×597-175×451? n ? ad bc ? 2 χ= = ≈16.373, ?a+b??c+d??a+c??b+d? 389×1 048×665×772 2

由于 16.373>10.828,所以能够在犯错误的概率不超过 0.001 的条件下,认 为种子灭菌与小麦黑穗病有关系.

1.(2014· 湖北高考改编)根据如下样本数据 x 3 4 5 -0.5 6 0.5 7 -2.0 8 -3.0

y 4.0 2.5

^=bx+a,则__________. 得到的回归方程为y

【解析】 作出散点图如下:

^=bx+a 的斜率 b<0,当 x=0 时,y ^=a>0.故 a 观察图象可知,回归直线y >0,b<0.

【答案】 a>0,b<0

2.(2014· 江西高考改编)某人研究中学生的性别与成绩、视力、智商、阅读量 这 4 个变量的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与 性别有关联的可能性最大的变量是__________. 表1 成绩 性别 男 女 总计 不及格 及格 总计 6 10 16 14 22 36 20 32 52

表2 视力 性别 男 女 总计 好 差 总计 4 16 20 32 52

12 20 16 36

表3 智商 性别 男 女 总计 偏高 正常 总计 8 8 16 12 24 36 20 32 52

表4 阅读量 性别 男 女 总计 丰富 不丰富 总计 14 2 16 6 30 36 20 32 52

【解析】 表 1 中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a +c=16,b+d=36,n=52,
2 52 × ? 6 × 22-14 × 10 ? 13 2 χ= =1 440. 20×32×16×36

表 2 中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b +d=36,n=52,
2 52 × ? 4 × 20-16 × 12 ? 637 2 χ= =360. 20×32×16×36

表 3 中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b +d=36,n=52,
2 52 × ? 8 × 24-12 × 8 ? 13 2 χ= =10. 20×32×16×36

表 4 中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b +d=36,n=52, 52×?14×30-6×2?2 3 757 k= = 160 . 20×32×16×36 13 13 637 3 757 ∵1 440<10<360< 160 , ∴与性别有关联的可能性最大的变量是阅读量.

【答案】 阅读量

3.(2014· 全国卷Ⅱ)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单 位:千元)的数据如下表: 年 份 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9

年份代号 t 人均纯收入 y

(1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均 纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.

附:回归直线的斜率和截距的最小二乘法估计公式分别为: -? ∑ ? t t ?? y -y i i i=1 ^ ^ - -b ^t. b= n , a = y 2 ∑ ? t t ? i i=1
n

【解】

1 (1)由所给数据计算得 t =7(1+2+3+4+5+6+7)=4,

1 y=7(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
2 ∑ ( t t ) =9+4+1+0+1+4+9=28, i i=1 7

- ) = (-3)×(-1.4) + (-2)×(-1) + (-1)×(-0.7) + 0×0.1 + 1×0.5 + ∑ ( t t )( y y i i i=1 2×0.9+3×1.6=14,

7

-? ∑ ? t t ?? y -y i i 14 i=1 ^ b= 7 =28=0.5, 2 ∑ ? t i- t ? i=1 ^ - -b ^ t =4.3-0.5×4=2.3, a=y ^=0.5t+2.3. 所求回归方程为y

7

^=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收 (2)由(1)知,b 入逐年增加,平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得 ^=0.5×9+2.3=6.8, y 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.

4.(2016· 全国卷Ⅲ)下图 13 是我国 2008 年至 2014 年生活垃圾无害化处理量 (单位:亿吨)的折线图. 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位: 亿吨)的折线图.

图 13 注:年份代码 1-7 分别对应年份 2008-2014.

(1)由折线图看出, 可用线性回归模型拟合 y 与 t 的关系, 请用相关系数加以 说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾 无害化处理量. 参考数据:∑ yi=9.32,∑ tiyi=40.17, i=1 i=1 ∑ 参考公式: 相关系数 r= ?ti- t ??yi- y ?,
i=1 n 7 7 2 ∑ ? y y ? =0.55, 7≈2.646. i i=1 n 2 2 ^=^ ∑ ? t t ? ∑ ? y y ? ) , 回归方程 y a+ i i i =1 i=1 n n 7

∑ ?ti- t ??yi- y ? =1 i ^t 中斜率和截距的最小二乘估计公式分别为b ^= n ^ - -b ^t. b , a = y 2 ∑ ? t t ? i i=1

【解】
7

(1)由折线图中的数据和附注中的参考数据得
2 2 ∑ ? y y ? =0.55, i i=1 7 7

t =4,∑ (ti- t ) =28, i=1
7 7

∑ (ti- t )(yi- y )=∑ tiyi- t ∑ yi=40.17-4×9.32=2.89, i=1 i =1 i =1 2.89 ∴r≈ ≈0.99. 0.55×2×2.646 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当大,从 而可以用线性回归模型拟合 y 与 t 的关系.

9.32 (2)由 y = 7 ≈1.331 及(1)得 ∑ ?ti- t ??yi- y ? 2.89 =1 i ^= 7 b = 28 ≈0.103. 2 ∑ ? t i- t ? i=1 ^ ^ t ≈1.331-0.103×4≈0.92. a= y -b ^=0.92+0.10t. 所以 y 关于 t 的回归方程为y ^=0.92+0.10×9=1.82. 将 2016 年对应的 t=9 代入回归方程得y 所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨.
7


赞助商链接