nbhkdz.com冰点文库

1.2

时间:2016-09-21


两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

分类变量:变量的不同”值”

表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 1. 吸烟与患肺癌之间有无关系? 2. 秃顶与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为 什么?

列联表:两个分 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的 类变量的频数表
调查了9965人,得到如下结果:

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

比例 0.54% 2.28%

问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可 能存在差异,我们再通过不同的图表来分析

三维柱形图

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

8000 7000 6000 5000 4000 3000 2000 1000 0

不吸烟 吸烟 不患肺癌
患肺癌

二维条形图

9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

等 高 条 形 图

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 不患肺癌

上面我们通过图形的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

为了使样本空间有一定的代表性,我们引入一个随机变量

n(ad ? bc) K ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

总计的四项

(n=a+b+c+d(样本容量))

若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计 算我们可以得到K的观测值: k=K2=56.632

表1-12
P(K2≥k) K。
0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.82 8

说明:根据统计学家的分析: P(K2≥10.828)≈0.001

P( K 2 ? k )

0.50

0.40

0.25

0.15

0.10

0.05

0.025 0.010 0.005

0.001

k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面的利用K2来检验“两个变量有 关系”的方法成为:独立性检验

?

说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 存活数 死亡数 总计
未用新药 用新药 总计 101 129 230 38 20 58 139 149 288

试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 K 观测值k为
2

288 ? ?101? 20 ? 38 ?129 ? k? ? 8.658 ? 7.879 139 ?149 ? 230 ? 58
2

99.5%的把握判定新药对防治小白兔是有效的.

例2.某心脏病医院为了研究秃顶是否与 心脏病有关,对665名男性心脏和772名 其他病人做了研究,是否可以以99%的 把握认为秃顶与心脏病有关? 智 慧 的 闪 光

患心脏病 214 秃顶 不秃顶 451 665 总计

!

不患心脏病 175 597 772

总计 389 1048 1437

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

解:假设“秃顶与患心脏病无关”
根据列联表中的数据, 得K 的观测值为 1437 ? ? 214 ? 597 ? 175 ? 451? k? ? 16.373 ? 6.635 389 ?1048 ? 665 ? 772
2 2

所以有99%的把握认为”秃顶与患心脏病有关”

? 秃顶=心脏病
研究人员表示,掉头发在很大程度上 是由日渐增大的工作压力、不能充分 休息、不正确饮食和睡眠不足等因素 引起的。在接受调查的人群中,有 41%的受秃头威胁的人表示,他们一 日睡觉时间不足4小时

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

x1 x2
总计

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d 不吸烟 吸烟 总计

不患肺癌
a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

8000 7000 6000

a
主对角线

5000 4000 副对角线 3000 2000 1000 0 不患肺癌

c

d
患肺癌

b

不吸烟 吸烟

(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

x1 x2
总计
9000 8000 7000 6000 5000 4000 3000 2000 1000 0

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d
患肺癌 不患肺癌

不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

b

满足条件X ? x1的个体中 具有Y ? y1的个体所占的

a

d c
吸烟

a 比例为 a?b 满足条件X ? x2的个体中 具有Y ? y1的个体所占的 c 比例为 c?d

不吸烟

(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度


化学反应工程习题课1、2

4 H 2 O 进入反应器的原料气中,甲醇:空气:水蒸气=2:4:1.3(摩尔比) ,反应后甲醇的转化率 达 72%,甲醛的收率为 69.2%。试计算 (1) 反应的选择性; (...

电力电子实验-2(1)

DDB She et of Dra wn By : 4 图 1-2 电流变送器与过流保护原理图 3.零速封锁器(DZS)零速封锁器的作用是当调速系统处于静车状态, 即速度给定电压为零...

高中生物必修二第1-2章测试题[1] 2

、选择题(本题包括 20 小题,每小题 2 分,共 40 分。 ) 1.基因型分别为 aaBbCCDd 和 AABbCCdd 两种碗豆杂交,其子代中纯合体的比例为 A.0 总数的 A....

【免费】【内部资料】1-2-2-1(10年秋)分数裂项.教师版

【免费】【内部资料】1-2-2-1(10年秋)分数裂项.教师版_六年级数学_数学_小学教育_教育专区。免费 内部资料 整数加减法 速算与巧算 题库版 真题 小学 答案 ...

二次根式测试题及答案【1】2

第二十一章填空题: 二次根式 1.要使根式 x ? 3 有意义,则字母 x 的取值范围是___. 2.当 x___时,式子 1 有意义. 2x ?1 3.要使根式 4 ? 3x ...

高中数学选修1-2知识点总结_图文

高中数学选修1-2知识点总结_数学_高中教育_教育专区。知识点总结选修 1-2 知识点总结第章 统计案例 1.线性回归方程 ①变量之间的两类关系:函数关系与相关关系...

12-13(2)期中测试题答案1

Y ~ B(n1 ? n 2 , p1 ? p 2 ) (B) X ~ P(? 1 ), Y ~ P(? 2 ), 且X, 相互独立,则 X ? Y ~ P(? 1 ? ? 2 ) Y 第2页 共5...

1寸2寸及各种证件照片标准尺寸像素

整理如下: 1 寸 2 寸电子版照片标准尺寸 1寸 打印尺寸 25×35(mm) 像素 295×413(px) 2寸 打印尺寸 35×49(mm) 像素 413×626(px) 英寸=72pt(点...

1高中数学必修2知识点总结

P α· L 2.1.2 空间中直线与直线之间的位置关系 1 空间的两条直线有如下三种关系: 相交直线:同一平面内,有且只有一个公共点; 共面直线 平行直线:同一...

有理数1.1-1.2测试题

有理数1.1-1.2测试题_数学_初中教育_教育专区。1.1—1.2 测试姓名___ 一. 选择题:(共 30 分) 1.- 1 的绝对值是( 2 B.- ) A.-2 1 2 C....