nbhkdz.com冰点文库

第6章 基因组


第六章 基因组
? 基因组:生物细胞中单套染色体的所含 DNA序列的全部组成。 人类基因组:22条常染色体和X,Y染色 体的DNA组成。

基因组大小
种类 大肠杆菌 啤酒酵母 线 虫 果 蝇 蝗 虫 小 鼠 豌 豆 玉 米 小 麦 人 Mb 4.64 12.1 100 140 5000 3300 4800 5000 17000 3000



C值悖论
? 生物体单倍体DNA总量称为 C值。 高等生物具有比低等生物更复杂的生命 活动,所以,理论上应该是它们的C值也 应该更高。但是事实上C值没有体现出与 物种进化程度相关的趋势。高等生物的C 值不一定就意味着它的C值高于比它低等 的生物。这种生物学上的DNA总量的比 较和矛盾,称为C值悖论。

分类最小基因组
支原体 细菌 酵母 霉菌 蠕虫 昆虫 鸟类 两栖类 哺乳类 0.58 2.8 3.0 5.5 1.1 0.5 0.2 0.1 2.8 X X X X X X X X X 106 106 107 107 108 109 1010 1010 1010

进化地位高,结构复杂的生 物的同类生物最小基因组比 较,符合进化程度越高,生 物基因组越大的规律。

DNA序列的分类
? 基因序列和非基因序列 基因序列:以起始密码子开始,终止密码子结 束的一段DNA序列,称为开放阅读框(open reading frame, ORF) 非基因序列:基因序列以外的DNA序列。 ? 编码序列和非编码序 编码序列:编码RNA和蛋白质的DNA序列。 非编码序:内含子和基因的间隔序列。

? 单一序列和重复序列 单一序列: 基因组中只有一份的DNA序列。 重复序列:基因组中重复出现的序列。例 如,STR,SNP,微卫星DNA等。

? 什么是基因? ? 基因在哪里?

寻找基因的思路:
基因定位 基因克隆 基因分离
将基因定位于染色体上

有大到小,由粗到细,精细定位

克隆目的基因片段

功能克隆
? 克隆(致病)基因的 一种策略。 ? 收集所要克隆的基因 的蛋白质产物及其功 能的信息,用以分离 基因,并对基因进行 定位。

疾病
性状 (疾病)

功能
蛋白质产 物(生物 学功能)

染色体定 位

从氨基酸序列 出发设计 DNA引物,从 文库调取基因

基因
得到基 因序列

分析异常基因的产物(蛋白质): 纯化蛋白质,弄清它是如何引起临床症状的有两 条不同的路线:
1. 进行氨基酸序列测定,据此推测可能的核苷酸序列,合成 寡核苷酸探针,然后用探针从cDNA文库或基因组文库中 筛选对应的编码基因; 2. 将异常蛋白质制成相应的抗体,从cDNA表达文库中筛选 相应克隆。得到克隆后,就可以通过DNA序列分析确定导 致疾病的分子缺陷。 绝大部分分子病、遗传性代谢缺陷(酶)病如白化病 (albinism)、苯丙酮尿症(phenylkeonuria, PKU)和 镰刀形细胞贫血病(sickle-cell disease)等,都是采取的 这一策略。

血红蛋白病——镰刀形细胞贫血症 正常HbA四条多肽链(2条?链,两条?链)

定位克隆
疾病
? 又称为“逆向遗传学”, 始于20世纪80年代后期 ? 利用遗传连锁或细胞学 定位技术将致病基因定 位于染色体的特定区带。 ? 定位:通过连锁分析找 出与目的基因紧密连锁 基因 的遗传标记在染色体上 序列 的位置。 ? 克隆:从定位的染色体 基因 区段内分离克隆所要的 基因,并进一步研究其 功能。
疾病

遗传标记, 染色体定位

mRNA cDNA

蛋白质产物 生物学功能

功能

定位克隆:通过遗传标记 ,先获得某一表型基因 在染色体上的定位 ,再在候选区域内选择已知基 因 ,进行致病突变的筛选 ,并获得cDNA及全基 因。

基本思路是通过连锁分析原理进行 基因定位。
若多态标记与待定基因距离较远 ,则它们在 向子代传递时会发生自由分离 ,呈“连锁平衡” ;反之 ,则不发生自由分离 ,而呈现“共分离” 现象 ,即“连锁不平衡”。据此可在染色体上定 位与某一DNA标记相连锁的基因。

1. 将基因定位于染色体 特定区段 2. 候选基因筛选鉴定

定位克隆的主要目的之一是将目标 基因定位于特定染色体上。 主要方法: 家系调查法 体细胞杂交法 核酸杂交技术 等等

A-1型短指(趾)症法拉比(Farabee) 1903 年在他的哈佛大学医学院博士毕业论 文中首先报道了,即世界上第一例孟德尔 常染色体显性遗传病,以后作为遗传学的 经典例子被全世界的生物学和遗传学教材 广泛引用。

贺林实验室利用布依族、苗族 和汉族的三个A-1型短指(趾)症大 家系,对该病的致病基因进行了精 确定位(位点定在2q35-36区)、克 隆,并首次发现了人IHH基因和该 基因上的三个突变位点是导致A-1型 短指(趾)症的直接原因。

用遗传标记进行基因定位
形态标记 morphological markers 细胞标记 cytological markers 生化标记 biochemical markers 分子标记 molecular markers

分子遗传标记
在核酸分子水平,对具有相对差 异的等位基因DNA多态性的标记,广 泛存在于高等生物编码区和非编码 区,又称为DNA分子标记,是DNA水 平上遗传变异的直接反映。

特点: 1. 直接以DNA形式表现,在生物体各发育阶段,各 组织均可检测到。 2.数量多,遍及整个基因组。 3.多态性高,自然界存在许多等位突变,无需专门 创造特殊的遗传材料 4. 中性,不影响目标性状的表达,与不良性状无 必然连锁 5. 许多分子标记表现为共显性(codominance), 能够鉴别出纯合基因型与杂 合基因型,提供完 整的遗传信息

分子遗传标记发展
RFLP restrict fragment length polymorphism
限制性片段长度多态性

SSLP simple sequence length polymorphism
简单序列长度多态性

SNP single nucleotide polymorphism
单核苷酸多态性

? SSLP simple sequence length polymorphism 简单序 列长度多态性 ,又称为VNTR variable number tandem repeat 数目可变的串联重复多态性 指重复单位相对较小,由重复单位的序列差异 和数目变化,可形成丰富的多态性。 包括: 小卫星序列 minisatellite 微卫星序列 microsatellite ,

? 小卫星DNA标记 minisatellite,核心序列 为11-60bp ,主要存在于染色体靠近端 粒处,由于其拷贝数变化,在不同个体 间中存在串联数目的差异,若在重复序 列两侧有限制性内切酶酶切位点,则切 下来的片段会呈现出多态性。可用于 DNA 指纹,DNA Finger。

? 微卫星 DNA 标记 microsatellite ,指以 2 - 7 个碱基为核心单位串联重复而成的 一 类 序 列 ( 微 卫 星 DNA microsatellite DNA,又称为STR short tandem repeat 短串联重复序列),由于核心序列重复数 目的变化而在群体中呈现出遗传多态性, 但在同一家系内具有高度的遗传保守性, 以孟德尔方式遗传。散布于整个基因组 中。

? SNP single nucleotide polymorphism 单核苷酸 多态性,是指在基因组内特定核苷酸位置 上存在两种不同碱基,其中最少一种在群 体中的频率不小于1%。 ? SNP分为两种形式: 基因编码区的SNP,称为cSNP 遍布于基因组内的大量单碱基变异

SNP分析的特点:
? ( 1 ) SNP 数量大,分步密集,平均 每1000bp就有一个SNP ? (2)SNP比STR扩增更有效,不会产 生假带 ? ( 3 )由于 SNP 是二态的,易于自动 化批量检测,易于用计算机分析结 果

? SNP与RFLP和STR等DNA标记的主要不 同在于:

不再以“长度”的差异作为检测手 段而是直接以序列的差异作为标记。 但 SNP 单个基因座的多态性很差, 只有二态,为此采用多个 SNP 基因 座进行“单倍型”分析十分重要。

? SNP是继人类基因组计划之后又 一国际研究竞争新热点,该项目 研究是阐明基因组功能及特点的 重 要 基 础 。 SNP 是 人 类 基 因 组 DNA序列变异的主要形式,是决 定人类疾病的重要遗传基础。

其他遗传标记举例
AFLP amplified fragment length polymorphism
扩增片段长度多态性

RAPD SSCP

random amplified polymorphism DNA
随机扩增多态性 single strand conformation polymorphism 单链构象多态性

? AFLP amplified fragment length polymorphism 扩增片段长度多态性 通过DNA PCR扩增基因 组DNA的模板,随后用电泳将扩增片段分离, 通过DNA谱带鉴别多态性。 ? RAPD random amplified polymorphism DNA 随机扩增多态性 用于扩增多态性DNA的引物是 随机的。在做多态性分析时,用一组引物(20- 40个)在基因组全序列上扫描可获得基因组多态 性的丰富信息。

SSCP single strand conformation polymorphism 单链构象多态性 是基于PCR扩增而新发展起 来的DNA多态性分析,利用PCR特异的扩 增出基因组的目的DNA片段,变性后形成 的单链DNA在自然条件下能形成一定的空 间构象,并且这种空间构象由DNA链的碱 基序列决定,若碱基发生变化,将在电泳图 谱上表现出不同生物个体的特异性,即多态 性。

用原位杂交 in situ hybridazation和 荧光原位杂交 fluorescence in situ hybridazation ,FISH 进行基因定位: 将DNA探针用同位素或荧光染料标记 ,按照碱基互补配对原则,与固定在 玻片上的中期染色体杂交后,在荧光 显微镜下呈现不同颜色的荧光。

FISH是一项十分灵敏的技术,可以 检测出非整倍体,基因扩增,微小的 染色体重排或易位等染色体变异

原位杂交

基因定位

多色FISH M-FISH技术

荧光原位杂交

FISH在肿瘤发生发展相关染色体变异方 面的研究应用:
比较基因组杂交技术 comparative genomic hybridization,CGH 利用同一种生物异常

细胞的基因组做探针,与正常细胞基因 组杂交,通过对杂交信号分析,发现不 同,寻找相关基因。

利用染

色体步 移确定
基因位 置

定位候选克隆
? ? 该方法是定位克隆的进 一步发展 将疾病相关基因定位于 染色体相关区域 该染色体区域得到若干 候选基因 进一步分析得到目的 cDNA 蛋白质功能研究

疾 病

?
? ?

染色体定位

蛋 白 质 功 能

若干候选基 因

确定目 的基因

cDNA筛选 染色体定位只是定位克隆的 第一步。由于cDNA筛选、确认的困难 ,使 其成为定位克隆策略的“瓶颈”。目前获得基 因序列的方法大致有: (1)对 < 50 0kb的关键部位进行直接测序; (2)比较基因组作图和测序; (3)基因结构特征分析; (4)cDNA捕获,主要有CpG岛捕捉层析 法、外显子捕捉法、直接筛选PCR法等方法

差异表达
原理: 比较不同个体或不同细胞来源 , 即通常所指的样本 (tester,T) 和参照 (driver,D) 的蛋白质或mRNA两者之 间的差异 ,如缺失或特异表达部分, 从 而发现新基因

1. 差异性表达mRNA方法 (1)mRNA差异显示(mRNA-Differential

Display,mRNA-DD)
(2)抑制性消减杂交(Suppression Subtractive

Hybridization,SSH)
(3)cDNA代表性差异分析(cDNA Representational Difference Analysis,cDNA-RDA) (4)cDNA microarray 2. 差异性表达蛋白质

消减杂交(subtractive hybrization)
利用目的基因在两种组织或细胞中表达的差 异,或者在不同发育阶段、不同状态下表达差 异,通过其mRNA或单链cDNA进行杂交,除 去两者之间相同的基因成分,使表达有差异的 基因得到充分富集。它的实质是对两组基因转 录本全面比较,去同存异,分离差异表达基因

Subtractive cloning

cDNA-RDA技术 cDNA-RDA(cDNA-Representative
Difference Analysis)技术是1994年Huband和Schatz在
RDA和mRNA-DD二者基础上建立的一种基因克隆新方法

特点:在代表性差异分析基础上,以mRNA表达水平的
差异为差减目标,因而兼有RDA和mRNA-DD的优点, 这一方法克服了mRNA-DD假阳性率高的缺点,排除

与表型无关的基因,通过消减杂交驱逐同源序列,降
低了后期鉴定的工作量,但操作烦琐。

肿瘤组织Driver
mRNA ds cDNA AAA Mbo I 酶切

正常组织Tester
AAA

连接接头PCR扩增

无接头 杂交

换新接头

无扩增

线性扩增

指数扩增

cDNA-RDA方法简要示意图

差异性表达蛋白质
因为同一种mRNA经不同的剪接或翻 译后修饰加工可产生多种蛋白质,因此一 个蛋白质组中蛋白质的数量超过相应基因 组的基因数目。
蛋白质组研究常用方法:

二维凝胶电泳技术,蛋白质序列分析, 质谱分析等等。

生物信息学方法
通过序列的ORF预测 ? 建立cDNA文库 ? 差减杂交得到均质化文库 ? cDNA序列测定 ? 生物信息学分析,ORF预测 ? 同源性比较,功能预测

生物信息学(bioinformatics)
是生物学,计算机科学,以及应用数学等学 科相互交叉而形成的一门新兴学科。 以计算机为主要工具,开发各种软件,对日 益增长的DNA和蛋白质的序列和结构等相 关信息进行收集、储存、发行、提取、加工 、分析和研究,同时建立理论模型,指导实 验研究。 由数据库、计算机网络和应用软件三大部分 构成,在基因组计划中发挥不可替代的作用

该定义包含两方面的内容

一方面是发展强大有效的信息分析工具,构 建适合于基因组研究的数据库,用于搜索、 管理、使用人类基因组和模式生物基因组的 巨量信息;
另一方面是配合实验研究,确定约30亿个碱 基对的人类基因组完整核苷酸顺序,找出人 类全部约10万个基因在染色体上的位置以及 包括基因在内的各种DNA片段的功能。

该定义包含两方面的内容

一方面是发展强大有效的信息分析工具,构 建适合于基因组研究的数据库,用于搜索、 管理、使用人类基因组和模式生物基因组的 巨量信息;
另一方面是配合实验研究,确定约30亿个碱 基对的人类基因组完整核苷酸顺序,找出人 类全部约10万个基因在染色体上的位置以及 包括基因在内的各种DNA片段的功能。

? 如:已知小鼠某基因在人当中有高度同 源序列 ? 用该小鼠cDNA比对人的EST数据库 ? 得到一簇EST后,将相邻的EST通过相互 重叠部分进行拼接。 ? 得到人对应的完整cDNA的序列后,两端 设计引物在cDNA文库中进行PCR,得到 该cDNA的克隆。 ? 至此,与小鼠对应的人的该基因得以克 隆出来。

通过EST拼接

EST拼接实例

小鼠基因比对人 EST的结果。通 过这一簇EST,可 拚接出对应的人 全长cDNA

基因芯片技术的应用
? 使用传统方法寻找新基因,不仅需要投 入大量的资金,而且针对性不强,效率 低下,绝大部分工作都是繁琐重复劳动。
? 通过基因芯片分析正常组织和疾病组织 基因表达情况的差异,往往能够从那些 表达异常的基因中发现新的致病基因。


普通遗传学 第6章 教案

第6 章 真核生物特殊的染色体作图 [ 教案 基本要求] 1. 掌握基因组和 C 值的概念; 2. 了解真核生物基因组 DNA 复杂度的检测 方法; 3. 了解基因家族的...

第六章 基因表达的调控

第六章 基因表达的调控 基因表达调控(gene expression regulation)是指生物体通过特定蛋白质与 DNA、 蛋白质与蛋白质之间的相互作用来控制基因是否表达,或调节表达...

第六章 疾病的多基因遗传

第六章 疾病的多基因遗传_临床医学_医药卫生_专业资料。第六章 疾病的多基因遗传...后选基因直接检测 E.基因组扫描 11.连锁分析方法的原理与用途 A.判定某一遗...

现代分子生物学第六章作业

现代分子生物学第六章作业 09 级一班 芮世杭 222009317011027 1, 列举两种研究基因表达模式的方法并简述其原理。 (1)基因表达序列分析技术(SAGE)是一种以 DNA ...

第6章 从杂交育种到基因工程

第六章从杂交育种到基因工程 26. (江苏)(7 分)甲磺酸乙酯(EMS)能使鸟嘌呤...(C)配对而与胸腺嘧啶(T)配对,从而使 DNA 序列中 G—C 对转换 成 A—T ...

第6章 从杂交育种到基因工程

第6章 从杂交育种到基因工程 一、选择题。 1、 下列关于基因工程技术的叙述,正确的是( ) A.重组 DNA 技术所用的工具酶是限制酶、连接酶和运载体 B.所有...

第六章测试第三课时

第6章 从杂交育种到基因工程练习题 教研组长: 年级主任: 教务主任: 一、选择...形成重组 DNA 分子,再转移到该玉米的培养细胞中,经筛 选和培养等获得转基因...

第6章 细胞的生命历程

第6章 细胞的生命历程 【复习重点】 1.简述细胞生长和增殖的周期性。 2.概述...右图是对动物细胞有丝分裂时染色体数(a)、染色单体数(b)和 DNA 分子数(c)...

初三生物第五章 第六章 第七章

本周教学内容:第五章 第六章 第七章 教学目标: 1. 识别遗传与变异,懂得遗传与变异的应用。 2. 说出遗传物质的作用,知道 DNA 基因和染色体的关系。 3. 举例...

第六章 回交育种

-2- 第六章 回交育种 (一)质量性状基因的回交转育 1.如果要转移的性状是由显性单基因控制,那么在回交过程中,转移的性状容易识 别,回交就比较容易进行。 2...