nbhkdz.com冰点文库

11.3变量间的相关关系、统计案例


中国教育培训领军品牌

§11.3
教学目标

变量间的相关关系、统计案例

1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要 求记忆). 3.了解回归分析的思想、方法及其简单应用. 4

.了解独立性检验的思想、方法及其初步应用.

学习内容

知识梳理
1.变量间的相关关系

2.散点图 以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图. 3.回归直线方程与回归分析
^

(1)直线方程y=a+bx,叫做 Y 对 x 的回归直线方程,b 叫做回归系数.要确定回归直线方程,只要确定 a 与回归 系数 b. (2)用最小二乘法求回归直线方程中的 a,b 有下列公式
n ^

b=

i 1

∑ xiyi-n x =
i=1

y
2

^

^

^

^

∑x2 i -n x

n

,a= y -b x ,其中的a,b表示是求得的 a,b 的估计值.

(3)相关性检验 ①计算相关系数 r,r 有以下性质:|r|≤1,并且|r|越接近 1,线性相关程度越强;|r|越接近 0,线性相关程度越弱; ②|r|>r0.05,表明有 95%的把握认为变量 x 与 Y 直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归 直线方程毫无意义. 4.独立性检验 (1)2×2 列联表: B 全力以赴赢在环雅 B 合计

1

中国教育培训领军品牌 A A 合计 n11 n21 n+1 n12 n22 n+2 n1+ n2+ n

其中 n1+=n11+n12,n2+=n21+n22,n+1=n11+n21,n+2=n12+n22,n=n11+n21+n12+n22. (2)χ2 统计量: n?n11n22-n12n21?2 χ2= . n1+n2+n+1n+2 (3)两个临界值:3.841 与 6.635 当 χ2>3.841 时,有 95%的把握说事件 A 与 B 有关; 当 χ2>6.635 时,有 99%的把握说事件 A 与 B 有关; 当 χ2≤3.841 时,认为事件 A 与 B 是无关的.

例题讲解

题型一 相关关系的判断 例1 5 个学生的数学和物理成绩如下表: 学生 学科 数学 物理 画出散点图,并判断它们是否具有相关关系. 思维启迪 将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两 A 80 70 B 75 66 C 70 68 D 65 64 E 60 62

个变量是否存在相关关系. 解 以 x 轴表示数学成绩,y 轴表示物理成绩,可得到相应的散点图如图所示.

由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关. 思维升华 判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量

之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱. 巩固 (1)对变量 x,y 有观测数据(xi,yi)(i=1,2,?,10),得散点图①;对变量 u,v 有观测数据(ui,vi)(i=1,2,?,

全力以赴赢在环雅

2

中国教育培训领军品牌 10),得散点图②,由这两个散点图可以判断( )

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 答案 C (2)(2012· 课标全国)在一组样本数据(x1,y1),(x2,y2),?,(xn,yn)(n≥2,x1,x2,?,xn 不全相等)的散点图中, 1 若所有样本点(xi,yi)(i=1,2,?,n)都在直线 y= x+1 上,则这组样本数据的样本相关系数为 2 ( A.-1B.0 1 C. D.1 2 答案 D 解析 利用相关系数的意义直接作出判断.
^ n ?yi-yi?2 i=1
?

)

^

样本点都在直线上时, 其数据的估计值与真实值是相等的, 即 yi=yi, 代入相关系数公式 r=

1-

n ?yi- i=1
?

= y ?2

1. 题型二 线性回归分析 例2 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下: 零件的个数 x(个) 加工的时间 y(小时) (1)在给定的坐标系中画出表中数据的散点图; 2 2.5 3 3 4 4 5 4.5

^

^

^

(2)求出 y 关于 x 的回归直线方程y=bx+a,并在坐标系中画出回归直线; (3)试预测加工 10 个零件需要多少小时? 全力以赴赢在环雅

3

中国教育培训领军品牌

^

i=1

?xiyi-n x y
^ 2 ^

n

(注:b=

i=1

?xi2-n x

n

,a= y -b x )

^

思维启迪 求回归直线方程的系数b时,为防止出错,应分别求出公式中的几个量,再代入公式. 解 (1)散点图如图.

(2)由表中数据得: ?xiyi=52.5,
i=1

4

x =3.5, y =3.5, ?x2 i =54,
i=1 ^ ^

4

∴b=0.7,∴a=1.05,
^

∴y=0.7x+1.05,回归直线如图所示.

^

(3)将 x=10 代入回归直线方程,得y=0.7×10+1.05=8.05, 故预测加工 10 个零件约需要 8.05 小时.
^ ^ ^

思维升华

(1)回归直线方程y=bx+a必过样本点的中心( x , y ).

(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线 性相关关系,则可通过回归直线方程估计和预测变量的值. 巩固 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月 1 号到 5 号每天打篮球时

间 x(单位:小时)与当天投篮命中率 y 之间的关系: 时间 x 命中率 y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4

小李这 5 天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月 6 号打 6 小时篮球的投篮命中 率为________. 答案 0.5 0.53 全力以赴赢在环雅

4

中国教育培训领军品牌 解析 小李这 5 天的平均投篮命中率 y=
^ ^ 0.4+0.5+0.6+0.6+0.4 =0.5,可求得小李这 5 天的平均打篮球时间 x =3.根据表中数据可求得b=0.01,a= 5 ^

0.47,故回归直线方程为y=0.47+0.01x,将 x=6 代入得 6 号打 6 小时篮球的投篮命中率约为 0.53. 题型三 独立性检验 例3 为调查某地区老年人是否需要志愿者提供帮助, 用简单随机抽样方法从该地区调查了 500 位老年人, 结果如下: 性别 是否需要志愿者 需要 不需要 (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例. (2)能否有 99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说 明理由. 思维启迪 直接计算 χ2 的值,然后利用表格下结论. 解 (1)调查的 500 位老年人中有 70 位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人 男 40 160 女 30 270

70 的比例的估计值为 ×100%=14%. 500 500×?40×270-30×160?2 (2)χ2= ≈9.967. 200×300×70×430 由于 9.967>6.635,所以有 99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年 人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女 两层并采用分层抽样方法,比采用简单随机抽样方法更好. 思维升华 (1)根据样本估计总体是抽样分析的一个重要内容. 要使估计的结论更加准确, 抽样取得的样本很关键.

(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而 看出独立性检验的作用. 巩固 某中学对“学生性别和是否喜欢看 NBA 比赛”作了一次调查,其中男生人数是女生人数的 2 倍,男生喜欢看

5 1 NBA 的人数占男生人数的 ,女生喜欢看 NBA 的人数占女生人数的 . 6 3 (1)若被调查的男生人数为 n,根据题意建立一个 2×2 列联表; (2)若有 95%的把握认为是否喜欢看 NBA 和性别有关,求男生至少有多少人? 解 (1)由已知得: 喜欢看 NBA 男生 5n 6 不喜欢看 NBA n 6 总计 n

全力以赴赢在环雅

5

中国教育培训领军品牌 女生 总计 3n 5n n n n 2 ? ·- · ? 2 6 3 66 3 (2)χ2= = n. nn 8 n· · · n 22 若有 95%的把握认为是否喜欢看 NBA 和性别有关, 3 则 χ2>3.841,即 n>3.841,n>10.24. 8 n n ∵ , 为整数,∴n 最小值为 12. 2 6 即:男生至少 12 人. n 6 n n 3 n 2 n 2 3n 2

综合题库

A组 1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ( × ) )

(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.
^

( √

)

(4)某同学研究卖出的热饮杯数 y 与气温 x(℃)之间的关系,得回归方程y=-2.352x+147.767,则气温为 2℃时,一 定可卖出 143 杯热饮. ( × ) )

(5)事件 X,Y 关系越密切,则由观测数据计算得到的 χ2 的值越大. ( √

(6)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有 99%的可能 物理优秀. 2.下面哪些变量是相关关系 A.出租车车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁块的大小与质量 答案 C 3.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了 100 位居民进行调查,经过计算 χ2≈0.99,根 据这一数据分析,下列说法正确的是 A.有 99%的人认为该电视栏目优秀 全力以赴赢在环雅 ( ) ( × ) ( )

6

中国教育培训领军品牌 B.有 99%的人认为该电视栏目是否优秀与改革有关系 C.有 99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系 答案 D 解析 只有 χ2≥6.635 才能有 99%的把握认为该电视栏目是否优秀与改革有关系,而既使 χ2≥6.635 也只是对“该 电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论, 与是否有 99%的人等无关. 故只有 D 正确. 4.在一项打鼾与患心脏病的调查中,共调查了 1671 人,经过计算 χ2=27.63,根据这一数据分析,我们有理由认为打 鼾与患心脏病是________的(填“有关”或“无关”). 答案 有关 5.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未用血清的人一年中的感冒 记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用”,利用 2×2 列联表计算得 χ2≈3.918,已知 P(χ2≥3.841)≈0.05.对此,四名同学作出了以下的判断: p:有 95%的把握认为“这种血清能起到预防感冒的作用”; q:若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; r:这种血清预防感冒的有效率为 95%; s:这种血清预防感冒的有效率为 5%. 则下列结论中,正确结论的序号是________. ①p∧﹁q;②﹁p∧q;③(﹁p∧﹁q)∧(r∨s); ④(p∨﹁r)∧(﹁q∨s). 答案 ①④ 解析 本题考查了独立性检验的基本思想及常用逻辑用语.由题意,得 χ2≈3.918,P(χ2≥3.841)≈0.05,所以,只 有第一位同学的判断正确,即有 95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题. B组
^

1.某地区调查了 2~9 岁的儿童的身高,由此建立的身高 y(cm)与年龄 x(岁)的回归模型为y=8.25x+60.13,下列叙述 正确的是 A.该地区一个 10 岁儿童的身高为 142.63cm B.该地区 2~9 岁的儿童每年身高约增加 8.25cm C.该地区 9 岁儿童的平均身高是 134.38cm D.利用这个模型可以准确地预算该地区每个 2~9 岁儿童的身高 答案 B 2.设(x1,y1),(x2,y2),?,(xn,yn)是变量 x 和 y 的 n 个样本点, 直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图), 以下结论中正确的是 A.直线 l 过点( x , y ) 全力以赴赢在环雅 ( ) ( )

7

中国教育培训领军品牌 B.x 和 y 的相关系数为直线 l 的斜率 C.x 和 y 的相关系数在 0 到 1 之间 D.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 答案 A 解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值, 它的绝对值越接近 1, 两个变量的线性相关 程度越强,所以 B、C 错误.D 中 n 为偶数时,分布在 l 两侧的样本点的个数可以不相同,所以 D 错误.根据线 性回归直线一定经过样本点中心可知 A 正确. 3.(2012· 湖南)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=
^

1,2,?,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确 的是 ... ( ) A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 答案 D 解析 由于回归直线方程中 x 的系数为 0.85, 因此 y 与 x 具有正的线性相关关系,故 A 正确. 又回归直线方程必过样本点中心( x , y ),因此 B 正确. 由回归直线方程中系数的意义知,x 每增加 1cm,其体重约增加 0.85kg,故 C 正确. 当某女生的身高为 170cm 时,其体重估计值是 58.79kg,而不是具体值,因此 D 不正确. 4.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 爱好 不爱好 总计 110×?40×30-20×20?2 计算可得 χ = ≈7.8. 60×50×60×50
2

女 20 30 50

总计 60 50 110

40 20 60

附表: P(χ2≥k) k 参照附表,得到的正确结论是 A.有 99%以上的把握认为“爱好该项运动与性别有关” B.有 99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” 全力以赴赢在环雅 0.050 3.841 0.010 6.635 ( )

8

中国教育培训领军品牌 D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” 答案 A 解析 根据独立性检验的定义,由 χ2≈7.8>6.635 可知我们有 99%以上的把握认为“爱好该项运动与性别有关”, 故选 A. 5.(2013· 大连模拟)某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元) 销售额 y(万元)
^ ^ ^ ^

4 49

2 26

3 39

5 54

根据上表可得回归直线方程y=bx+a中的b为 9.4,据此模型预报广告费用为 6 万元时销售额为 ( A.63.6 万元 C.67.7 万元 答案 B 4+2+3+5 7 49+26+39+54 解析 ∵ x = = ,y= =42, 4 2 4
^ ^ ^

)

B.65.5 万元 D.72.0 万元

又y=bx+a必过( x , y ),
^ ^ 7 ∴42= ×9.4+a,∴a=9.1. 2 ^

∴回归直线方程为y=9.4x+9.1.
^

∴当 x=6 时,y=9.4×6+9.1=65.5(万元). 6.以下四个命题,其中正确的序号是________. ①从匀速传递的产品生产流水线上,质检员每 20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽 样; ②两个随机变量相关性越强,则相关系数的绝对值越接近于 1;
^ ^

③在回归直线方程y=0.2x+12 中,当解释变量 x 每增加一个单位时,预报变量y平均增加 0.2 个单位; ④对分类变量 X 与 Y,它们的随机变量 χ2 来说,χ2 越小,“X 与 Y 有关系”的把握程度越大. 答案 ②③ 解析 ①是系统抽样;对于④,随机变量 χ2 越小,说明两个相关变量有关系的把握程度越小.
^

7.已知回归方程y=4.4x+838.19,则可估计 x 与 y 的增长速度之比约为________. 答案 5∶22 解析 x 每增长 1 个单位,y 增长 4.4 个单位,故增长的速度之比约为 1∶4.4=5∶22. 事实上所求的比值为回归直线方程斜率的倒数. 8.某数学老师身高 176cm,他爷爷、父亲和儿子的身高分别是 173cm、170cm 和 182cm.因儿子的身高与父亲的身高有 关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 答案 185 全力以赴赢在环雅

9

中国教育培训领军品牌 解析 儿子和父亲的身高可列表如下: 父亲身高 儿子身高
^ ^ ^

173 170
^

170 176
^

176 182
^ ^

设回归直线方程为y=a+bx, 由表中的三组数据可求得b=1, 故a= y -b x =176-173=3, 故回归直线方程为y= 3+x,将 x=182 代入得孙子的身高为 185cm. 9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂 生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表: 甲厂:

乙厂:

(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面 2×2 列联表,问是否有 99%的把握认为“两个分厂生产的零件的质量有差异”? 甲厂 优质品 非优质品 合计 乙厂 合计



360 (1)甲厂抽查的 500 件产品中有 360 件优质品,从而估计甲厂生产的零件的优质品率为 =72%; 500

320 乙厂抽查的 500 件产品中有 320 件优质品,从而估计乙厂生产的零件的优质品率为 =64%. 500 (2)完成的 2×2 列联表如下: 甲厂 优质品 非优质品 合计 由表中数据计算 1000×?360×180-320×140?2 χ2= ≈7.35>6.635, 500×500×680×320 全力以赴赢在环雅 360 140 500 乙厂 320 180 500 合计 680 320 1000

10

中国教育培训领军品牌 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. 10.(2013· 重庆)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数 据资料,算得 ?xi=80, ?yi=20, ?xiyi=184, ?x2 i =720.
i=1 i=1 i=1 i=1 ^ ^ ^ ^ 10 10 10 10

(1)求家庭的月储蓄y对月收入 x 的回归直线方程y=bx+a; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄.

^

^

^

^

i=1

?xiyi-n x y
^ 2 ^

n

附:回归直线方程y=bx+a中,b=

i=1

?x2 i -n x

n

,a= y -b x ,其中 x , y 为样本平均值.



1n 80 (1)由题意知 n=10, x = ?xi= =8, ni=1 10

1n 20 y = ?yi= =2, ni=1 10
2 2 又 lxx= ?x2 i -n x =720-10×8 =80, i=1 n

lxy= ?xiyi-n x y =184-10×8×2=24,
i=1 ^ lxy 24 由此得b= = =0.3, lxx 80 ^ ^

n

a= y -b x =2-0.3×8=-0.4,
^

故所求回归直线方程为y=0.3x-0.4.
^

(2)由于变量 y 的值随 x 值的增加而增加(b=0.3>0),故 x 与 y 之间是正相关.
^

(3)将 x=7 代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).

C组 1.下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
^

②设有一个回归方程y=3-5x,变量 x 增加一个单位时,y 平均增加 5 个单位;
^ ^ ^

③回归方程y=bx+a必过( x , y ); ④有一个 2×2 列联表中,由计算得 χ2=13.079,则有 99%的把握确认这两个变量间有关系. 全力以赴赢在环雅

11

中国教育培训领军品牌 其中错误的个数是 A.0 C .2 答案 B 解析 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①
^

( B.1 D.3

)

正确;回归方程中 x 的系数具备直线斜率的功能,对于回归方程y=3-5x,当 x 增加一个单位时,y 平均减少 5 个 单位, ②错误; 由回归直线方程的定义知, 回归直线方程y=bx+a必过点( x ,y ), ③正确; 因为 χ2=13.079>6.635, 故有 99%的把握确认这两个变量有关系,④正确.故选 B. 2.(2013· 福建)已知 x 与 y 之间的几组数据如下表: x y
^ ^ ^ ^

1 0
^

2 2
^

3 1

4 3

5 3

6 4

假设根据上表数据所得线性回归直线方程y=bx+a, 若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程 为 y=b′x+a′,则以下结论正确的是
^ ^ ^

(

)
^

A.b>b′,a>a′
^ ^

B.b>b′,a<a′
^ ^

C.b<b′,a>a′ 答案 C
^

D.b<b′,a<a′

6 ?xi- i=1
?

x ??yi- y ? x ?2 求得.

解析 b′=2,a′=-2,由公式b=

6 ?xi- i=1
?

^ ^ 5 ^ 13 5 7 1 b= ,a= y -b x = - × =- , 7 6 7 2 3 ^ ^

∴b<b′,a>a′.选 C. 3.有甲、乙两个班级进行数学考试, 按照大于等于 85 分为优秀,85 分以下非优秀统计成绩, 得到如下所示的列联表: 优秀 甲班 乙班 合计 2 已知在全部 105 人中随机抽取 1 人,成绩优秀的概率为 ,则下列说法正确的是( 7 A.列联表中 c 的值为 30,b 的值为 35 B.列联表中 c 的值为 15,b 的值为 50 C.根据列联表中的数据,若按 95%的可靠性要求,能认为“成绩与班级有关系” D.根据列联表中的数据,若按 95%的可靠性要求,不能认为“成绩与班级有关系” 答案 C 全力以赴赢在环雅 ) 10 c 非优秀 b 30 总计

12

中国教育培训领军品牌 解析 由题意知,成绩优秀的学生数是 30,成绩非优秀的学生数是 75, 所以 c=20,b=45,选项 A、B 错误. 105×?10×30-20×45?2 根据列联表中的数据,得到 χ = ≈6.6>3.841, 55×50×30×75
2

因此有 95%的把握认为“成绩与班级有关系”. 4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验.根据收集到的数据(如下表),
^

由最小二乘法求得回归方程y=0.67x+54.9. 零件数 x(个) 加工时间 y(min) 10 62 20 30 75 40 81 50 89

现发现表中有一个数据看不清,请你推断出该数据的值为________. 答案 68 解析 由已知可计算求出 x =30,而回归直线必过点( x , y ), 则 y =0.67×30+54.9=75,设模糊数字为 a,则 a+62+75+81+89 =75,计算得 a=68. 5 5.为了解某班学生喜爱打篮球是否与性别有关,对该班 50 名学生进行了问卷调查,得到了如下的 2×2 列联表: 喜爱打篮球 男生 女生 总计 20 10 30 不喜爱打篮球 5 15 20 总计 25 25 50

则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示). P(χ2≥k0) k0 答案 0.5% 50×?20×15-5×10?2 解析 χ2= ≈8.333>7.879, 25×25×30×20 所以在犯错误的概率不超过 0.005 的前提下认为喜爱打篮球与性别有关. 6.(2013· 福建)某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工人 200 名.为研究工人的日平均生产量是 否与年龄有关,现采用分层抽样的方法,从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,然后按 工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产件数分成 5 组: [50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图. 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828

全力以赴赢在环雅

13

中国教育培训领军品牌

(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列联表,并判断是否有 90% 的把握认为“生产能手与工人所在的年龄组有关”? n?n11n22-n12n21?2 附:χ2= n1+n2+n+1n+2 P(χ2≥k) k 解 0.100 2.706 0.050 3.841 0.010 6.635 0.001 10.828

(1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名.

所以,样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),记为 A1,A2,A3; 25 周岁以下组工人有 40×0.05=2(人),记为 B1,B2. 从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2), (A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有 1 名“25 周岁以下组”工人的可能结果共有 7 种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2), (A3,B1),(A3,B2),(B1,B2). 7 故所求的概率 P= . 10 (2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”中的生产能手 60×0.25=15(人),“25 周 岁以下组”中的生产能手 40×0.375=15(人),据此可得 2×2 列联表如下: 生产能手 25 周岁以上组 25 周岁以下组 合计 100×?15×25-15×45?2 25 所以得 χ2= = ≈1.79. 14 60×40×30×70 因为 1.79<2.706. 所以没有 90%的把握认为“生产能手与工人所在的年龄组有关”. 15 15 30 非生产能手 45 25 70 合计 60 40 100

归纳总结
方法与技巧 全力以赴赢在环雅

14

中国教育培训领军品牌
^ ^ ^ ^

1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产
^ ^

生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同.) 2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们 之间贴近的数学表达式; (2)根据一组观察值, 预测变量的取值及判断变量取值的变化趋势; (3)求出回归直线方程. 3.根据 χ2 的值可以判断两个分类变量有关的可信程度. 失误与防范 1.相关关系与函数关系的区别 相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系. 例如正方形面积 S 与边长 x 之间的关系 S =x2 就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品 的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提. 2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才 有实际意义,否则,求出的回归直线方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生 的值.

全力以赴赢在环雅

15


§11.3 变量间的相关关系、统计案例

§ 11.3 变量间的相关关系统计案例 1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它...

11.3 变量间的相关关系、统计案例练习题

11.3 变量间的相关关系统计案例练习题_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 11.3 变量间的相关关系统计案例练习题_数学_高中教育_...

10.3变量间的相关关系、统计案例

第三节 变量间的相关关系统计案例 4 第三节 变量间的相关关系统计案例 星子中学数学组 郭清山 2015年2月11日星期三 2.回归方程 (1)最小二乘法 如果有...

变量间的相关关系、统计案例

变量间的相关关系统计案例_数学_高中教育_教育专区。§11.3 教学目标 变量间的相关关系统计案例 1.会作两个有关联变量的数据的散点图,并利用散点图认识...

10.3变量间的相关关系、统计案例作业

10.3变量间的相关关系统计案例作业_高考_高中教育_教育专区。2015高考复习PPT...三、解答题 11.某地最近十年粮食需求量逐年上升,下表是部分统计数据: 2002 ...

变量间的相关关系与统计案例

变量间的相关关系统计案例_数学_高中教育_教育专区。课时作业(五十五) n?ad...(℃) 发芽数 12 月 1日 10 23 12 月 2日 11 25 12 月 3日 13 30 ...

10.3变量间的相关关系与统计案例

第三节 变量间的相关关系统计案例 [备考方向要明了] 考什么 1.会作两个...(11.8,3),(12.5,4),(13,5);变量 U 与 V 相对应的一组数据为(10,...

变量间的相关关系、统计案例

变量间的相关关系统计案例_数学_高中教育_教育专区。变量间的相关关系统计案例§ 11.3 2014 高考会这样考 复习备考要这样做 实际问题中的应用. 变量间的相关...

第十章第3讲变量间的相关关系、统计案例

第十章第3讲变量间的相关关系统计案例_数学_高中教育_教育专区。第 3 讲 ...8.2 8.6 10.0 11.3 11.9 6.2 7.5 8.0 8.5 9.8 ^ ^ ^ ^ ^ -...