nbhkdz.com冰点文库

第6章 基因组

时间:2015-02-26


第六章 基因组
? 基因组:生物细胞中单套染色体的所含 DNA序列的全部组成。 人类基因组:22条常染色体和X,Y染色 体的DNA组成。

基因组大小
种类 大肠杆菌 啤酒酵母 线 虫 果 蝇 蝗 虫 小 鼠 豌 豆 玉 米 小 麦 人 Mb 4.64 12.1 100 140 5000 3300 4800 5000 17000 3000

C值悖论
? 生物体单倍体DNA总量称为 C值。 高等生物具有比低等生物更复杂的生命 活动,所以,理论上应该是它们的C值也 应该更高。但是事实上C值没有体现出与 物种进化程度相关的趋势。高等生物的C 值不一定就意味着它的C值高于比它低等 的生物。这种生物学上的DNA总量的比 较和矛盾,称为C值悖论。

分类最小基因组
支原体 细菌 酵母 霉菌 蠕虫 昆虫 鸟类 两栖类 哺乳类 0.58 2.8 3.0 5.5 1.1 0.5 0.2 0.1 2.8 X X X X X X X X X 106 106 107 107 108 109 1010 1010 1010

进化地位高,结构复杂的生 物的同类生物最小基因组比 较,符合进化程度越高,生 物基因组越大的规律。

DNA序列的分类
? 基因序列和非基因序列 基因序列:以起始密码子开始,终止密码子结 束的一段DNA序列,称为开放阅读框(open reading frame, ORF) 非基因序列:基因序列以外的DNA序列。 ? 编码序列和非编码序 编码序列:编码RNA和蛋白质的DNA序列。 非编码序:内含子和基因的间隔序列。

? 单一序列和重复序列 单一序列: 基因组中只有一份的DNA序列。 重复序列:基因组中重复出现的序列。例 如,STR,SNP,微卫星DNA等。

? 什么是基因? ? 基因在哪里?

寻找基因的思路:
基因定位 基因克隆 基因分离
将基因定位于染色体上

有大到小,由粗到细,精细定位

克隆目的基因片段

功能克隆
? 克隆(致病)基因的 一种策略。 ? 收集所要克隆的基因 的蛋白质产物及其功 能的信息,用以分离 基因,并对基因进行 定位。

疾病
性状 (疾病)

功能
蛋白质产 物(生物 学功能)

染色体定 位

从氨基酸序列 出发设计 DNA引物,从 文库调取基因

基因
得到基 因序列

分析异常基因的产物(蛋白质): 纯化蛋白质,弄清它是如何引起临床症状的有两 条不同的路线:
1. 进行氨基酸序列测定,据此推测可能的核苷酸序列,合成 寡核苷酸探针,然后用探针从cDNA文库或基因组文库中 筛选对应的编码基因; 2. 将异常蛋白质制成相应的抗体,从cDNA表达文库中筛选 相应克隆。得到克隆后,就可以通过DNA序列分析确定导 致疾病的分子缺陷。 绝大部分分子病、遗传性代谢缺陷(酶)病如白化病 (albinism)、苯丙酮尿症(phenylkeonuria, PKU)和 镰刀形细胞贫血病(sickle-cell disease)等,都是采取的 这一策略。

血红蛋白病——镰刀形细胞贫血症 正常HbA四条多肽链(2条?链,两条?链)

定位克隆
疾病
? 又称为“逆向遗传学”, 始于20世纪80年代后期 ? 利用遗传连锁或细胞学 定位技术将致病基因定 位于染色体的特定区带。 ? 定位:通过连锁分析找 出与目的基因紧密连锁 基因 的遗传标记在染色体上 序列 的位置。 ? 克隆:从定位的染色体 基因 区段内分离克隆所要的 基因,并进一步研究其 功能。
疾病

遗传标记, 染色体定位

mRNA cDNA

蛋白质产物 生物学功能

功能

定位克隆:通过遗传标记 ,先获得某一表型基因 在染色体上的定位 ,再在候选区域内选择已知基 因 ,进行致病突变的筛选 ,并获得cDNA及全基 因。

基本思路是通过连锁分析原理进行 基因定位。
若多态标记与待定基因距离较远 ,则它们在 向子代传递时会发生自由分离 ,呈“连锁平衡” ;反之 ,则不发生自由分离 ,而呈现“共分离” 现象 ,即“连锁不平衡”。据此可在染色体上定 位与某一DNA标记相连锁的基因。

1. 将基因定位于染色体 特定区段 2. 候选基因筛选鉴定

定位克隆的主要目的之一是将目标 基因定位于特定染色体上。 主要方法: 家系调查法 体细胞杂交法 核酸杂交技术 等等

A-1型短指(趾)症法拉比(Farabee) 1903 年在他的哈佛大学医学院博士毕业论 文中首先报道了,即世界上第一例孟德尔 常染色体显性遗传病,以后作为遗传学的 经典例子被全世界的生物学和遗传学教材 广泛引用。

贺林实验室利用布依族、苗族 和汉族的三个A-1型短指(趾)症大 家系,对该病的致病基因进行了精 确定位(位点定在2q35-36区)、克 隆,并首次发现了人IHH基因和该 基因上的三个突变位点是导致A-1型 短指(趾)症的直接原因。

用遗传标记进行基因定位
形态标记 morphological markers 细胞标记 cytological markers 生化标记 biochemical markers 分子标记 molecular markers

分子遗传标记
在核酸分子水平,对具有相对差 异的等位基因DNA多态性的标记,广 泛存在于高等生物编码区和非编码 区,又称为DNA分子标记,是DNA水 平上遗传变异的直接反映。

特点: 1. 直接以DNA形式表现,在生物体各发育阶段,各 组织均可检测到。 2.数量多,遍及整个基因组。 3.多态性高,自然界存在许多等位突变,无需专门 创造特殊的遗传材料 4. 中性,不影响目标性状的表达,与不良性状无 必然连锁 5. 许多分子标记表现为共显性(codominance), 能够鉴别出纯合基因型与杂 合基因型,提供完 整的遗传信息

分子遗传标记发展
RFLP restrict fragment length polymorphism
限制性片段长度多态性

SSLP simple sequence length polymorphism
简单序列长度多态性

SNP single nucleotide polymorphism
单核苷酸多态性

? SSLP simple sequence length polymorphism 简单序 列长度多态性 ,又称为VNTR variable number tandem repeat 数目可变的串联重复多态性 指重复单位相对较小,由重复单位的序列差异 和数目变化,可形成丰富的多态性。 包括: 小卫星序列 minisatellite 微卫星序列 microsatellite ,

? 小卫星DNA标记 minisatellite,核心序列 为11-60bp ,主要存在于染色体靠近端 粒处,由于其拷贝数变化,在不同个体 间中存在串联数目的差异,若在重复序 列两侧有限制性内切酶酶切位点,则切 下来的片段会呈现出多态性。可用于 DNA 指纹,DNA Finger。

? 微卫星 DNA 标记 microsatellite ,指以 2 - 7 个碱基为核心单位串联重复而成的 一 类 序 列 ( 微 卫 星 DNA microsatellite DNA,又称为STR short tandem repeat 短串联重复序列),由于核心序列重复数 目的变化而在群体中呈现出遗传多态性, 但在同一家系内具有高度的遗传保守性, 以孟德尔方式遗传。散布于整个基因组 中。

? SNP single nucleotide polymorphism 单核苷酸 多态性,是指在基因组内特定核苷酸位置 上存在两种不同碱基,其中最少一种在群 体中的频率不小于1%。 ? SNP分为两种形式: 基因编码区的SNP,称为cSNP 遍布于基因组内的大量单碱基变异

SNP分析的特点:
? ( 1 ) SNP 数量大,分步密集,平均 每1000bp就有一个SNP ? (2)SNP比STR扩增更有效,不会产 生假带 ? ( 3 )由于 SNP 是二态的,易于自动 化批量检测,易于用计算机分析结 果

? SNP与RFLP和STR等DNA标记的主要不 同在于:

不再以“长度”的差异作为检测手 段而是直接以序列的差异作为标记。 但 SNP 单个基因座的多态性很差, 只有二态,为此采用多个 SNP 基因 座进行“单倍型”分析十分重要。

? SNP是继人类基因组计划之后又 一国际研究竞争新热点,该项目 研究是阐明基因组功能及特点的 重 要 基 础 。 SNP 是 人 类 基 因 组 DNA序列变异的主要形式,是决 定人类疾病的重要遗传基础。

其他遗传标记举例
AFLP amplified fragment length polymorphism
扩增片段长度多态性

RAPD SSCP

random amplified polymorphism DNA
随机扩增多态性 single strand conformation polymorphism 单链构象多态性

? AFLP amplified fragment length polymorphism 扩增片段长度多态性 通过DNA PCR扩增基因 组DNA的模板,随后用电泳将扩增片段分离, 通过DNA谱带鉴别多态性。 ? RAPD random amplified polymorphism DNA 随机扩增多态性 用于扩增多态性DNA的引物是 随机的。在做多态性分析时,用一组引物(20- 40个)在基因组全序列上扫描可获得基因组多态 性的丰富信息。

SSCP single strand conformation polymorphism 单链构象多态性 是基于PCR扩增而新发展起 来的DNA多态性分析,利用PCR特异的扩 增出基因组的目的DNA片段,变性后形成 的单链DNA在自然条件下能形成一定的空 间构象,并且这种空间构象由DNA链的碱 基序列决定,若碱基发生变化,将在电泳图 谱上表现出不同生物个体的特异性,即多态 性。

用原位杂交 in situ hybridazation和 荧光原位杂交 fluorescence in situ hybridazation ,FISH 进行基因定位: 将DNA探针用同位素或荧光染料标记 ,按照碱基互补配对原则,与固定在 玻片上的中期染色体杂交后,在荧光 显微镜下呈现不同颜色的荧光。

FISH是一项十分灵敏的技术,可以 检测出非整倍体,基因扩增,微小的 染色体重排或易位等染色体变异

原位杂交

基因定位

多色FISH M-FISH技术

荧光原位杂交

FISH在肿瘤发生发展相关染色体变异方 面的研究应用:
比较基因组杂交技术 comparative genomic hybridization,CGH 利用同一种生物异常

细胞的基因组做探针,与正常细胞基因 组杂交,通过对杂交信号分析,发现不 同,寻找相关基因。

利用染

色体步 移确定
基因位 置

定位候选克隆
? ? 该方法是定位克隆的进 一步发展 将疾病相关基因定位于 染色体相关区域 该染色体区域得到若干 候选基因 进一步分析得到目的 cDNA 蛋白质功能研究

疾 病

?
? ?

染色体定位

蛋 白 质 功 能

若干候选基 因

确定目 的基因

cDNA筛选 染色体定位只是定位克隆的 第一步。由于cDNA筛选、确认的困难 ,使 其成为定位克隆策略的“瓶颈”。目前获得基 因序列的方法大致有: (1)对 < 50 0kb的关键部位进行直接测序; (2)比较基因组作图和测序; (3)基因结构特征分析; (4)cDNA捕获,主要有CpG岛捕捉层析 法、外显子捕捉法、直接筛选PCR法等方法

差异表达
原理: 比较不同个体或不同细胞来源 , 即通常所指的样本 (tester,T) 和参照 (driver,D) 的蛋白质或mRNA两者之 间的差异 ,如缺失或特异表达部分, 从 而发现新基因

1. 差异性表达mRNA方法 (1)mRNA差异显示(mRNA-Differential

Display,mRNA-DD)
(2)抑制性消减杂交(Suppression Subtractive

Hybridization,SSH)
(3)cDNA代表性差异分析(cDNA Representational Difference Analysis,cDNA-RDA) (4)cDNA microarray 2. 差异性表达蛋白质

消减杂交(subtractive hybrization)
利用目的基因在两种组织或细胞中表达的差 异,或者在不同发育阶段、不同状态下表达差 异,通过其mRNA或单链cDNA进行杂交,除 去两者之间相同的基因成分,使表达有差异的 基因得到充分富集。它的实质是对两组基因转 录本全面比较,去同存异,分离差异表达基因

Subtractive cloning

cDNA-RDA技术 cDNA-RDA(cDNA-Representative
Difference Analysis)技术是1994年Huband和Schatz在
RDA和mRNA-DD二者基础上建立的一种基因克隆新方法

特点:在代表性差异分析基础上,以mRNA表达水平的
差异为差减目标,因而兼有RDA和mRNA-DD的优点, 这一方法克服了mRNA-DD假阳性率高的缺点,排除

与表型无关的基因,通过消减杂交驱逐同源序列,降
低了后期鉴定的工作量,但操作烦琐。

肿瘤组织Driver
mRNA ds cDNA AAA Mbo I 酶切

正常组织Tester
AAA

连接接头PCR扩增

无接头 杂交

换新接头

无扩增

线性扩增

指数扩增

cDNA-RDA方法简要示意图

差异性表达蛋白质
因为同一种mRNA经不同的剪接或翻 译后修饰加工可产生多种蛋白质,因此一 个蛋白质组中蛋白质的数量超过相应基因 组的基因数目。
蛋白质组研究常用方法:

二维凝胶电泳技术,蛋白质序列分析, 质谱分析等等。

生物信息学方法
通过序列的ORF预测 ? 建立cDNA文库 ? 差减杂交得到均质化文库 ? cDNA序列测定 ? 生物信息学分析,ORF预测 ? 同源性比较,功能预测

生物信息学(bioinformatics)
是生物学,计算机科学,以及应用数学等学 科相互交叉而形成的一门新兴学科。 以计算机为主要工具,开发各种软件,对日 益增长的DNA和蛋白质的序列和结构等相 关信息进行收集、储存、发行、提取、加工 、分析和研究,同时建立理论模型,指导实 验研究。 由数据库、计算机网络和应用软件三大部分 构成,在基因组计划中发挥不可替代的作用

该定义包含两方面的内容

一方面是发展强大有效的信息分析工具,构 建适合于基因组研究的数据库,用于搜索、 管理、使用人类基因组和模式生物基因组的 巨量信息;
另一方面是配合实验研究,确定约30亿个碱 基对的人类基因组完整核苷酸顺序,找出人 类全部约10万个基因在染色体上的位置以及 包括基因在内的各种DNA片段的功能。

该定义包含两方面的内容

一方面是发展强大有效的信息分析工具,构 建适合于基因组研究的数据库,用于搜索、 管理、使用人类基因组和模式生物基因组的 巨量信息;
另一方面是配合实验研究,确定约30亿个碱 基对的人类基因组完整核苷酸顺序,找出人 类全部约10万个基因在染色体上的位置以及 包括基因在内的各种DNA片段的功能。

? 如:已知小鼠某基因在人当中有高度同 源序列 ? 用该小鼠cDNA比对人的EST数据库 ? 得到一簇EST后,将相邻的EST通过相互 重叠部分进行拼接。 ? 得到人对应的完整cDNA的序列后,两端 设计引物在cDNA文库中进行PCR,得到 该cDNA的克隆。 ? 至此,与小鼠对应的人的该基因得以克 隆出来。

通过EST拼接

EST拼接实例

小鼠基因比对人 EST的结果。通 过这一簇EST,可 拚接出对应的人 全长cDNA

基因芯片技术的应用
? 使用传统方法寻找新基因,不仅需要投 入大量的资金,而且针对性不强,效率 低下,绝大部分工作都是繁琐重复劳动。
? 通过基因芯片分析正常组织和疾病组织 基因表达情况的差异,往往能够从那些 表达异常的基因中发现新的致病基因。


赞助商链接

第6章 从杂交育种到基因工程

第6章 从杂交育种到基因工程_畜牧兽医_农林牧渔_专业资料。第六章章节概述 从...目的基因是依据基因工程设计中所需要的某些 DNA 分子片段,含有所需要的完整的...

第6章第六章核 酸

间接证据:同一种生物的不同种类的不同生长期的细胞,DNA 含量基本恒定。 第六章 核酸 核酸是遗传物质 1868 年瑞士 Miesher.从脓细胞的细胞核中分离出可溶于碱...

第六章 从杂交育种到基因工程 练习

那么“转基因动物”是指 () A.提供基因的动物 B.基因组中录入了外源基因的动物 C.基因组出现了新基因的动物 D.能表达基因遗传信息的动物第六章 从杂交育种到...

第六章 基因表达调控

第六章 基因表达调控 Regulation of Gene Expression 生物体的代谢调节尽管有不同...(gene expression)就是指在一定调节因素的作用下,DNA 分子上特定的基因 被激活...

第6章 单元测试题

一种限制 性内切酶能识别 DNA 洛阳市第四十六中学 生物必修二 导学案 第六章 单元测试题 一、选择题 1、实施基因工程第一步的一种方法是把所需的基因从供体...

第五章。第六章测试提及答案

高一年级生物必修二第五章、第六章节测试题 班级: 一:单选题(40 个) 1.基因工程的操作工具“剪刀”指的是( ) A.限制酶 B.DNA 连接酶 C.运载体 D.解旋...

初三生物第五章 第六章 第七章

本周教学内容:第五章 第六章 第七章 教学目标: 1. 识别遗传与变异,懂得遗传与变异的应用。 2. 说出遗传物质的作用,知道 DNA 基因和染色体的关系。 3. 举例...

第六章 第一节 遗传的物质基础 基因的表达

邗江区蒋王中学高二生物教学案 第六章 第一节 遗传的物质基础 三 基因的表达...能描述基因的概念,指出基因与染色体、DNA 的关系。 2.基因控制蛋白质的合成。...

基因八第六章教案说课

大家好下午好,下面我将给大家介绍一下第六章 基因的成簇与重复,这一章的内容...排列在同一条染色体上的基因家族本书中介绍的是组蛋白基因家族。在人类基因组 ...

高二生物 必修二 第六章 第七章 试卷

高二生物 必修二 第六章 第七章 试卷一、单项选择题(选择题每空 1 分) 1...这种“金色大米”形成的全过程中可以不需要的酶是 A.限制性核酸内切酶 B.DNA ...