导图社区 朱玉贤《现代分子生物学》考点精讲及思路
朱玉贤《现代分子生物学》考点精讲及思路,有图文,必备复习资料分享,复习用、预习用,提高学习效率,希望对大家备考有所帮助。
编辑于2024-04-16 17:54:10朱玉贤《现代分子生物学》
第一章 绪 论
第 一 节 分子生物学发展的基础
分子生物学建立时期重要事件及其学说:
创世说
进化论
细胞学说
遗传学
生物化学
一、创世说和进化论
3 个与一切生物学现象有关的问题:
生命是怎样起源的?
为什么“有其父必有其子 ”?
动、植物个体是怎样从一个受精卵发育而来的?
直到 19 世纪初,只能用迷信或宗教回答。19 世纪末,达尔文生物进化学说,成为生物学发展史上的伟大创举之一
二、细胞学说的建立
十七世纪末十八世纪初,荷兰的 Leeuwenhoek 制作了世界上第一台显微镜,并观察了诸多生物样本。大约与其同时代的 Hooke 第一个提出“细胞 ”一词。
十九世纪,德国植物学家 Schleiden 和动物学家 Schwann 建立了细胞学说。
他们认为:所有组织的最基本单元是形状非常相似而又高度分化的细胞。细胞的发生和形成是生物界普遍和永久的规律
三、经典的生物化学和遗传学
进化论和细胞学说的结合,产生了现代生物学。而以研究动、植物遗传变异规律为目标的遗传学和以分离纯化、鉴定细胞内含物质为目标的生物化学则是这一学科的两大支柱
( 一)经典的生物化学的
十九世纪,人们就已经发现了蛋白质。到二十世纪初,组成蛋白质的 20 种氨基酸被相继发现。 Fisher 还论证了连接相邻氨基酸的“肽键 ”的形成。细胞的其他成分,如脂类、糖类和核酸也相继被认识和部分纯化
1869 年,Misescher 首次从莱茵河鲑鱼精子中分离到 DNA 。
1910 年,德国科学家 Kossel 首先分离得到了腺嘌呤、胸腺嘧啶和组氨酸。
(二)经典遗传学的建立和发展
1865 年,奥地利科学家孟德尔(Gregor Mendel) 发表了《植物杂交试验》一书,提出了遗传学的两条基本规律:统一律和分离律。他认为:生物的每一种性状都是由遗传因子控制的,这些因子可以从亲代到子代,代代相传
1909 年,丹麦遗传学家 W. Johannsen 首先使用“基因 ”一词。
美国人托马斯.摩尔根(T.H.Morgan)第一个用实验证明"基因”学说的科学家
二十世纪初,美国遗传学家 Morgan 提出了基因学说。他指出:种质必须由独立的要素组成,我们把这些要素称为遗传因子,或者简单地称为基因。Morgan 及其助手发现了连锁遗传规律,并且第一次将代表某一性状的基因,同某一特定的染色体联系起来。
遗传因子:①生物的每一种性状都是由遗传因子控制的 ②在体细胞内,遗传因子是成对存在的
第 二 节 分子生物学发展简史
分子生物学:研究核酸、蛋白质等所有生物大分子的形态、结构特征及其重要性、规律性和相互关系的科学。
研究水平:分子水平
研究对象:一切生命形式
1928 年英国科学家 Griffith 等人发现肺炎链球菌可以引起肺炎,导致小鼠死亡。
1944 年美国微生物学家 Avery 通过肺炎链球菌对小鼠的感染实验,证明 DNA 是遗传信息的载体
遗传物质是DNA而不是蛋白质的实验证据。 【解析]证明DNA是遗传物质的两个关键性实验是:肺炎球菌在老鼠体内的毒性和T2噬菌体感染大肠杆菌。 [答案](1)肺炎球菌在老鼠体内的毒性实验:先将烧煮杀灭活性的光滑型致病菌(S型)、以及活的粗糙型细菌(R型)分别侵染小鼠,发现这些细菌自然丧失了致病能力。当将经烧煮杀死的S型细菌和活的 R型细菌混合再感染小鼠时,实验小鼠每次都死亡了。解剖死鼠,发现有大量活的S型(而不是R型)细菌。实验表明,死细菌DNA进行了可遗传的转化,从而导致小鼠死亡。 (2)T2 噬菌体感染大肠杆菌:当细菌培养基中分别带有“S或”P标记的氨基酸或核苷酸,子代噬菌体就相应含有“S标记的蛋白质或P标记的核酸。分别用这些噬菌体感染没有放射性标记的细菌,经过1~2个噬菌体DNA复制周期后进行检测,子代噬菌体中几乎不含带3S标记的蛋白质,但含有30%以上的”P 标记。说明在噬菌体传代过程中发挥作用的可能是DNA,而不是蛋白质。
1952年,A.D. Hershey和M. Chase进行了证实DNA是噬菌体遗传物质的噬菌体感染实验。该实验有力地证明了DNA是噬菌体遗传信息的载体
1953 年 Watson 和 Crick 提出 DNA 右手双螺旋模型,于 1962 年和 Wilkins 共享诺贝尔生理医学奖
①由两条反向平行的多核苷酸链围绕同一中心轴构成的右手螺旋结构 ②由核苷酸间的磷酸二酯酶的走向决定方向,一条从5'→3',另一条从3'→5' ③链接有螺旋形的凹槽,有一个较浅叫“小沟”,一个较深叫“大沟” ④两条链上的碱基以氢键相连,G与C配对,A与T配对 ⑤嘌呤和嘧啶碱基对层叠于双螺旋的内侧 ⑥顺着螺旋轴心从上向下看,可见碱基平面与纵轴垂直,且螺旋的轴心穿过氢键的中点 ⑦相邻碱基对平面之间的距离为0.34 nm,即顺中心轴方向,每隔0.34nm有一个核苷酸,以3.4nm为一个结构重复周期 ⑧核苷酸的磷酸基团与脱氧核糖在外侧,通过磷酸二酯键相连接而构成DNA分子骨架 ⑨脱氧核糖环平面与纵轴大致平行,双螺旋的直径为2.0 nm
1954 年 Crick 提出遗传信息传递的中心法则。
同年,Sanger 首次阐明了胰岛素的一级结构,开创了蛋白质序列分析的先河,他于 1958 年获诺贝尔化学奖
1958 年,Meselson 和 Stahl 提出了 DNA 的半保留复制。
1961 年,法国科学家 Jacob 和 Monod 提出了调节基因表达的操纵元( operon) 模型,1965 年获得诺贝尔生理医学奖。他们还首次提出了信使核糖酸( mRNA)的存在及作用
同年,Nirenberg 等人应用合成的 mRNA 分子[poly(U)]破译出第一批遗传密码。
1966 年,美国科学家 Nirenberg 等人破译了全部的 DNA 遗传密码,1969 年与 Holley 和 Khorana 分享了诺贝尔生理医学奖
1967 年发现了可将 DNA 连接起来的 DNA 连接酶。
1970 年 Smith、Qilcox 及 Kelley 分离到第一种可以在 DNA 特定位点将 DNA 分子切开的限制性核酸内切酶。同年,美国人 Temin 和 Baltimore 发现 RNA 肿瘤病毒中存在逆转录酶,他们于 1975 年共享诺贝尔生理学奖
1972 年,Berg、Boyer 等人第一次成功地完成了 DNA 重组实验。
1974 年,首次实现了异源真核生物的基因在大肠杆菌中的表达。
1975 ~ 1977 年,美国人 Sanger 和 Gilbert 发明了快速 DNA 序列测定技术,并于 1977 年完成了噬菌体 ΦX174 基因组(5386bp)的序列测定。1980 年 Sanger 和 Gilbert 与 Berg 分享了诺贝尔化学奖
1976 年 cDNA 克隆技术的建立,使分子生物学更加迅速广泛地渗透到医学各学科,发展了各学科的分子理论基础
1982 年 Prusiner 提出“感染性蛋白质颗粒 ”的存在;次年将这种蛋白颗粒命名为阮病毒蛋白(PrP)
1997 年,Prusiner 因为发现朊病毒而获得诺贝尔生理医学奖。
1984 年,德国免疫学家 Georges K. hler、阿根廷裔美国生物化学家 César Milstein 和丹麦免疫学家NielsKai Jerne 由于发展了单克隆抗体技术而分享了诺贝尔生理医学奖
1986 年,美国 Cetus 公司人类遗传研究室的年轻科学家 Kary. B . Mullis 发明了 PCR 技术。1993年 Mullis 与第一个设计定点突变的 Smith 共享了诺贝尔化学奖
2002 年 12 月 10 日第一百零二届诺贝尔奖颁发。美国科学家约翰·芬恩(John B . Fenn , 美国科 学家,1917 年 -)、日 本 科 学 家 田 中 耕 一 ( Koichi Tanaka ) 、瑞 士 科 学 家 库 尔 特 · 维 特 里 希 ( Kurt Wüthrich)教授因发明了对生物大分子进行确认和结构分析、质谱分析的方法,而共同获得诺贝尔化学
2003 年诺贝尔生理学或医学奖授予美国科学家保罗·劳特布尔和英国科学家彼得·曼斯菲尔德,以表彰他们在核磁共振成像技术领域的突破性成就。他们的成就是医学诊断和研究领域的重大成果。西澳大利亚大学(UWA)临床医学教授 - - Barry J. Marshall , 长期从事胃溃疡的临床诊断、治 疗及分子机理等问题的研究。 由于 Marshall 教授在这些领域的突出贡献,2005 年他与 J. R. Warren教授共同分享了诺贝尔生理与医学奖
当年,他与 J. R. Warren 教授合作研究时,亲自吃下幽门螺杆菌(Helicobacter pylori) 。
2006年,美国科学家Fire和Mello由于在揭示控制遗传信息流动的基本机制--Rna干扰方面的杰出贡献而获得诺贝尔生理学或医学奖
第二章 染色体与 DNA
第 一 节 染色体
一、染色体的概念
1 . 染色体概念的建立
孟德尔的工作被认为是生物学史上最重大的发现之一,然而他的工作在沉没 30 多年以后才被人 们重新发现,这其中非常重要的一点是,在孟德尔时代没有一个人知道基因的物理结构是怎样的,它们位于细胞中的什么地方,它们又是怎样从亲代传到子代的,等等。也就是说至 1866 年的时候还没有关于染色体、有丝分裂及减数分裂的描述
孟德尔定律重新发现后,有大量的杂交实验证明他的理论是正确的,这样就迫使人们去思考、去研究孟德尔的遗传因子究竟是什么,它的结构是怎样的,它们在细胞的什么地方,细胞中什么样的结 构与假设的遗传因子(基因)是相一致的等等。
在孟德尔的工作被重新发现后的 1903 年,W. Suntton 和 T. Boveri 各自独立地认识到,染色体从一 代到一代的传递方式与基因从一代到一代的传递方式有着密切的平行关系。为了解释这种相关性, 他们提出了基因位于染色体上的假设,即遗传的染色体学说 。
遗传学发展的重要里程碑正是由于接受了这一概念,即细胞学提供的在显微镜下可以看到的染 色体的行为与杂交实验的遗传因子的行为相关联,它标志着遗传学与细胞学的结合。直到今天,这一 学说仍然是遗传分析最本质的一部分。
2 . 染色体概念
染色体—遗传物质的主要载体。
染色体在遗传上起着主要作用,因为亲代能够将自己的遗传物质以染色体 的形式 传给子代,保持了物种的稳定性和连续性。
3 . 染色质与染色体
染色质是存在于真核生物间期细胞核内的一种易被碱性染料着色的无定形物质,是伸展开的 DNA 蛋白质纤维,每一条染色体是由一个线性的、完整的、双螺旋的 DNA 分子,加上围绕其中的组蛋白和非组蛋白所组成的,是细胞分裂间期遗传物质的存在形式。
染色体则是染色质在细胞分裂过程中经过紧密缠绕、折叠、凝缩、精巧包装而成的 具有固定形态的遗传物质存在形式,是高度螺旋化的 DNA 蛋白质纤维。
染色质和染色体是真核生物遗传物质存在的两种不同形态,两者不存在成分上的差异,仅反映它 们处于细胞分裂周期的不同功能阶段而已。
染色体这一概念除指真核生物细胞分裂中期具有一定形态特征的染色质外,现在已扩大为包括 原核生物及细胞器在内的基因载体的总称。
4 . 原核生物染色体
大部分原核生物的染色体形态比较简单,它只是一条裸露的或与少数蛋白质结合的 DNA 或 RNA 双链或单链分子。
5 . 染色体数目
每一种生物的染色体数目是恒定的。多数高等动植物是二倍体 , 也就是说,每一体细胞 中有两组同样的染色体,用 2n 表示;亲本的每一配子带有一组染色体,叫单倍体, 用 n 表示。 如人的染色体是 46(2n = 46) , 果蝇的染色体是 8(2n = 8) 。但多数微生物的营养体是单倍体,如链孢 霉的单倍体染色体数是 7( n = 7) 。同一物种内每条染色体所带 DNA 的量是一定的,但不同染色体或 不同物种之间变化很大,比如,人 X 染色体有 1 . 28 亿个核苷酸对,而 Y 染色体只有 0.19 亿个核苷酸对
人类 22 对染色体及性染色体显微结构图
人类基因组各条染色体中碱基对数量和推导的功能基因数量对照
主要动、植物种类的染色体数
6 . 染色体的特征
作为遗传物质,染色体具有如下特征:
①分子结构相对稳定;
②能够自我复制,使亲子代之间保持连续性;
③能够指导从而控制整个生命过程;
④能够产生可遗传的变异。
二、真核细胞染色体的组成
( 一 )真核细胞染色体蛋白质
染色体蛋白主要分为组蛋白和非组蛋白两类。
组蛋白是染色体的结构蛋白,分为 H1 、H2A、H2B 、H3 及 H4 五种,与 DNA 共同组成核小体。
组蛋白含有大量的赖氨酸和精氨酸,其中 H3 、H4 富含精氨酸,富含赖氨酸。H2A、H2B 介于两者之间
真核细胞染色体组蛋白特性
进化上的极端保守性。
不同种生物组蛋白的氨基酸组成十分相似。牛、猪、大鼠的 H4 氨酸序列完全相同,与豌豆序列相比也只有两个氨基酸的差异
无组织特异性
只有鸟类、鱼类及两栖类红细胞染色体不含 H1 而带有 H5 , 精细胞染色体的组蛋白是鱼精蛋白。
肽链上氨基酸分布的不对称性
碱性氨基酸集中分布在 N 端的半条链上,而大部分疏水基团都分布在 C 端。碱性的半条链易与DNA 的负电荷区结合,而另外半条链与其他组蛋白、非组蛋白结合。
存在较普遍的修饰作用
如甲基化、乙基化、磷酸化及 ADP 核糖基化等。修饰作用只发生在细胞周期的特定时间和组蛋白的特定位点上
富含赖氨酸的组蛋白H5
真核细胞染色体上的组蛋白成分分析
非组蛋白约为组蛋白总量的 60% ~ 70% ,可能有 20 ~ 100 种(常见的有 15 ~ 20 种),主要包括酶 类、与细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物蛋白以及肌动蛋白、肌球蛋白、微管蛋白、原肌 蛋白等
( 二)真核细胞染色体 DNA
真核细胞基因组的最大特点是它含有大量的重复序列,而且功能 DNA 序列大多被不编码蛋白质 的非功能 DNA 所隔开,这就是著名的“C 值反常现象”。所谓 C 值,通常是指一种 生物单倍体基因组 DNA 的总量。
各种生物细胞内 DNA 总量的比较
同类生物不同种属之间 DNA 总量变化很大。
从编码每类生物所需的 DNA 量的最低值看,生物细胞中的 C 值具有从低等生物到高等生物逐渐增加的趋势
真核细胞 DNA 序列分类:
不重复序列
在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占 DNA 总量的 10% ~ 80% 。不重复 序列长约 750 ~ 2 000bp , 相当于一个结构基因的长度。蛋清蛋白、蚕的丝心蛋白、血红蛋白和珠蛋白等都是单拷贝基因
中度重复序列
这类序列的重复次数在 101 ~ 104 之间,占总 DNA 的 10% ~ 40% , 如小鼠中占 20% , 果蝇中占15% , 各种 rRNA、tRNA 以及某些结构基因如组蛋白基因等都属于这一类。
非洲爪蟾的 rRNA 基因结构示意图
在动物卵细胞形成过程,rDNA 可进行几千次不同比例的复制,产生 2 ×106 个拷贝,使 rDNA 占卵细胞 DNA 的 75% , 从而使该细胞能积累 1012 个核糖体,以合成大量蛋白质供细胞分裂之需.
高度重复序列—卫星 DNA
只存在于真核生物中,占基因组的 10% ~ 60% , 由 6 ~ 100 个碱基组成,在 DNA 链上串联重复高 达数百万次。因为卫星 DNA 不转录,其功能不详。它们是异染色质的成份,可能与染色体的稳定性有关
真核生物DNA序列特点
具有重复序列
编码遗传信息、DNA序列不同,携带的遗传信息不同
有些序列编码蛋白质或RNA,称为功能DNA,不编码的称为非功能DNA,不同生物中功能DNA占基因组的比例不同
(三)染色质和核小体
由 DNA 和组蛋白组成的染色质纤维细丝是许多核小体连成的念珠状结构。
染色质 DNA 的 Tm 值比自由 DNA 高,说明在染色质中 DNA 极可能与蛋白质分子相互作用。
在染色质状态下,由 DNA 聚合酶和 RNA 聚合酶催化的 DNA 复制和转录活性大大低于在自由DNA 中的反应
DNA 酶 I(DNaseI)对染色质 DNA 的消化远远慢于对纯 DNA 的作用。
用小球菌核酸酶处理染色质以后进行电泳,便可以得到一 系列片段,这些被保留的 DNA 片段均为 200bp 基本单位的倍数
核小体是染色质的基本结构单位,由 ~ 200 bp DNA 和组蛋白八聚体组成
DNA + 组蛋白八聚体→ 核小体核心 146bp + H1 → 染色小体 166bp + DNA →核小体 ( ~ 200 bp of DNA)
核小体单元的产生
核小体由 H2A、H2B 、H3 、H4 各两个分子生成的八聚体和由大约 200bp DNA 组成。
八聚体在中间,DNA 分子盘绕在外,而每个核小体只有一个 H1 , 分布在核小体的外面。
核小体由 H2A、H2B 、H3 、H4 各两个分子生成的八聚体和由大约 200bp DNA 组成。
八聚体在中间,DNA 分子盘绕在外,而每个核小体只有一个 H1 , 分布在核小体的外面
核心颗粒包括组蛋白八聚体及与其结合的 146bp DNA , 该序列绕在八聚体外面 1 . 75 圈,每圈约 80bp 。 由许多核小体构成了连续的染色质 DNA 细丝
染色体 DNA 结构示意图
两段各含 10 个螺旋的染色质
一个螺旋中包含 30 个莲座状结构
每个莲座状结构中都有 6 个环状 DNA
每个环状结构中含有 75000 bp
30 nm 结构:Solenoid(螺线管)
染色体 DNA 的念珠状结构
双链 DNA
在核小体中,DNA 盘绕组蛋白八聚体核心,使分子收缩 1 /7 。
人中期染色体中含 6 . 2 ×109 碱基对,其理论长度应是 200cm , 这么长的 DNA 被包装在 46 个 5μm长的圆柱体(染色体)中,其压缩比约为 104 。分裂间期染色质比较松散,压缩比大约是 102 ~ 103
染色体形成过程中长度与宽度的变化
三、原核生物染色体的组成
原核生物的基因组很小,大多只有一条染色体,且 DNA 含量少,如大肠杆菌 DNA 的相对分子质量仅为 4 . 6 ×106 , 其完全伸展总长约为 1 . 3 mm , 含 4000 多个基因
原核生物基因主要是单拷贝基因,只有很少数基因,如 rRNA 基因.以多拷贝形式存在;整个染色 体 DNA 几乎全部由功能基因与调控序列所组成;几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状
原核细胞 DNA 特点
结构简炼
原核 DNA 分子的绝大部分是用来编码蛋白质的,只有很小一部分控制基因表达的序列不转录。如在 ΦX174 中不转录部分只占 4% 左右 217/5386) , T4 DNA 中占 5 . 1% (282/5577) 。
存在转录单元
原核生物 DNA 序列中功能相关的 RNA 和蛋白质基因,往往丛集在基因组的一个或几个特定部位,形成转录单元并转录产生含多个 mRNA 的分子,称为多顺反子 mRNA
有重叠基因
一些细菌和动物病毒存在重叠基因,同一段 DNA 能携带两种不同蛋白质的信息。1973 年,Wein-er 和 Weber 在研究一种大肠杆菌 RNA 病毒时发现,有两个基因从同一起点开始翻译,一个在 400bp处结束,而在 3% 的情况下,翻译可一直进行下去直到 800bp 处碰到双重终止信号时才停止
1977 年,Sanger 正式发现了重叠基因:
Φ×174 感染寄主后共合成 9 个蛋白质,相对分子质量约 2 . 5 ×105 , 相当于 6 078 个核苷酸,而病 毒 DNA 本身只有 5 375 个核苷酸。Sanger 在弄清 Φ×174 DNA 的全部核苷酸序列及各个基因的起迄位臵和密码数目以后发现,9 个基因中有些是重叠的
基因重叠可能是生物进化过程中自然选择的结果。
第 二 节 DNA 的结构
一、DNA 的一级结构
DNA是一种高分子化合物,其基本单位是脱氧核苷酸。DNA 的一级结构是指 4 种核苷酸的连接及其排列顺序,表示了该 DNA 分子的化学构成。在 DNA 分子中,磷酸和脱氧核糖是不变的,而 4 种含氮碱基即腺嘌呤(A) 、鸟嘌呤(G) 、胞嘧啶(C)和胸腺嘧啶(T)是可变的。
2 - 脱氧核糖(左)和核糖(右)结构式
组成 DNA 分子的 4 种碱基:
胸腺嘧啶(T)
胞嘧啶(C)
腺嘌呤(A)
鸟嘌呤(G)
组成 DNA 和 RNA 分子的五种含氮碱基的结构式
碱基、核苷和核苷酸
在 DNA 分子中,嘌呤永远与嘧啶配对,而且腺嘌呤(A) 只能与胸腺嘧啶(T) 配对,鸟嘌呤( G) 只 能与胞嘧啶(C)配对。如一条链上某一碱基是 C , 另一条链上与它配对的碱基必定是 G。碱基之间的这种一一对应的关系叫碱基互补配对原则
DNA 链的基本特点是:
DNA 是由两条互相平行的脱氧核苷酸长链盘绕而成的。
DNA 分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。
两条链上的碱基通过氢键相结合,形成碱基对。
二、DNA 的二级结构
DNA 不仅具有严格的化学组成,还具有特殊的高级结构,它主要以有规则的双螺旋形式存在。
DNA 的二级结构是指两条多核苷酸链反向平行盘绕所生成的双螺旋结构。
通常情况下,DNA 的二级结构分两大类:一类是右手螺旋,如 A - DNA 和 B - DNA;另一类是左手螺旋,即 Z - DNA 。
表 2 - 8 不同螺旋形式 DNA 分子主要参数比较
DNA 二级结构中左手螺旋—Z - DNA 的研究
B - DNA 是最常见的 DNA 构象,A - DNA 和 Z - DNA 可能具有不同的生物活性。
Z1 - DNA 调控基因转录的两个模式
在邻近调控系统中,与调节区相邻的转录区被 Z - DNA 抑制,只有当 Z - DNA 转变为 B - DNA后,转录才得以活化
在远距离调控系统中,Z - DNA 可通过改变负超螺旋水平,决定聚合酶能否与模板链相结合而调节转录起始活性
三、DNA 的高级结构
DNA 的高级结构是指 DNA 双螺旋进一步扭曲盘绕所形成的特定空间结构。超螺旋结构是 DNA高级结构的主要形式,可分为正超螺旋与负超螺旋两大类,它们在特殊情况下可以相互变,如:
研究细菌质粒 DNA 时发现,天然状态下该 DNA 以负超螺旋为主,稍被破坏即出现开环结构,两 条链均断开则呈线性结构。在电场作用下,相同分子质量的超螺旋 DNA 比线性 DNA 迁移率大,线性DNA 又比开环的 DNA 迁移率大,以此可判断质粒结构是否被破坏。
第 三 节 DNA 复制
一、DNA 复制半保留复制
生命的遗传实际上是染色体 DNA 自我复制的结果,而染色体 DNA 的自我复制主要是通过半保留复制来实现的,是一个以亲代 DNA 分子为模板合成子代 DNA 链的过程。
由于 DNA 是遗传信息的载体,因此亲代 DNA 必须以自身分子为模板来合成新的分子—准确地复制成两个拷贝,并分配到两个子代细胞中去,才能真正完成其遗传信息载体的使命。
由于 DNA 分子由两条多核苷酸链组成,两条链上的碱基— G 只能与 C 相配对,A 只能与 T 相配对,所以,两条链是互补的,一条链上的核苷酸排列顺序决定了另一条链上的核苷酸排列顺序。
DNA 的半保留复制
DNA 在复制过程中,每条链分别作为模板合成新链,产生互补的两条链。这样新形成的两个 DNA 分子与原来 DNA 分子的碱基顺序完全一样。因此,每个子代分子的一条链来自亲代 DNA , 另一条链则是新合成的,这种复制方式被称为 DNA 的半保留复制。
1958 年,Meselson 和 Stahl 研究了经15 N 标记 3 个世代的大肠杆菌 DNA , 首次证明了 DNA 的半保留复制。
DNA 的半保留复制保证了 DNA 在代谢上的稳定性,与 DNA 的遗传功能相符合。
DNA 的半不连续复制
由于 DNA 双螺旋的两条链是反向平行的,因此在复制叉附近解开的 DNA 链一条是 5 ’→3 ’方 向,另一条是 3 ’→5 ’方向,两个模板极性不同。而所有已知 DNA 聚合酶的合成方向都是 5 ’→3 ’, 两条链无法同时进行复制。为了解释 DNA 的等速复制现象,日本学者冈崎(Okazaki) 提出了 DNA 的 半不连续复制模型
(1) 用 3H 脱氧胸苷短时间标记后提取 DNA , 得到不少平均长度为 2 - 3kb DNA 片段。
(2) 用 DNA 连接酶温度敏感突变株进行实验,在连接酶不起作用的温度下,有大量小片段累积,说明复制过程中至少有一条链首先合成较短的片段,然后再生成大分子 DNA 。
(3) 前导链的连续复制和滞后链的不连续复制在生物界是有普遍性的,因而称之为 DNA 的半不连续复制。
二、复制的起点、方向和速度
复制时,双链 DNA 要解开成两股链分别进行,所以,复制起点呈叉子形式,被称为复制叉
DNA 的复制是由固定的起始点开始的。一般把生物体的复制单位称为复制子 , 一个复制子只含一个复制起点。
表 2 - 9 部分生物复制子的比较
细菌、病毒和线粒体的DNA分子都是作为单个复制子完成复制的
真核生物基因组可以同时在多个复制起点上进行双向复制,也就是说它们的基因组包含有多个复制子
放射自显影技术表明染色体复制子为双向复制。
实验结果表明,无论是原核生物还是真核生物,DNA 的复制主要是从固定的起始点以双向等速复制方式进行的。复制叉以 DNA 分子上某一特定顺序为起点,向两个方向等速生长前进。
放射性标记实验证明 DNA 的复制是从固定的起始点双向等速进行的.
A . DNA 仅用[3H]胸腺嘧啶标记 10 min 即压 X 光片;
B . DNA 在[3H] 标记 10 min 后又继续非标记合成 10 min , 导致 X 光片上的复制叉变长,银颗粒分布广而稀少
三、复制的几种主要方式
1 . 线性 DNA 双链的复制
2 . 环状 DNA 双链的复制
θ型
滚环型
D - 环型
图 2 - 19 大肠杆菌质粒 DNA 双向复制的模式与实验验证
上:θ形复制模式图;
下:3H 标记质粒 DNA 合成图。
D loop 是单向复制的特殊方式。首先在动物线粒体中被发现。一条短 RNA 与一条 DNA 互补,取 代了该区域原来的互补的 DNA 链,使得两条链的合成高度不对称,一条链上迅速合成出互补链,另一条链则为游离的单环。
第 四 节 原核生物和真核生物 DNA 复制的特点
一、原核生物 DNA 复制的的特点
大肠杆菌基因组以双链环状 DNA 分子的形式存在,其 DNA 复制的中间产物可形成一个 θ, 复制 从定点开始双向等速进行,复制起始区位于其遗传图的 84min 附近。复制起始后,两个复制叉在距起始点 180 °处会合。
1 . DNA 双螺旋的解旋
首先,在拓扑异构酶Ⅰ 的作用下解开负超螺旋,并与解链酶共同作用,在复制起点处解开双链。解链过程中必需有 SSB 蛋白来稳定已解开的单链,以保证该局部结构不会恢复成双链。
接着,由引发酶等组成的引发体迅速作用于两条单链 DNA 上。不论是前导链还是滞后链,都需要一段 RNA 引物以开始子链 DNA 的合成。
由大肠杆菌 oriC 复制起始点处引发的 DNA 复制过程
大约 20 个 DnaA 蛋白在 ATP 的作用下与 oriC 处的 4 各 9 bp 保守序列相结合。
在 Hu 蛋白和 ATP 的共同作用下,DnaA 复制起始复合物使 3x13 bp 直接重复序列变形,形成开链。
DnaB(解链酶)六体分别与单链 DNA 相结合(需要 DnaC 的帮助)进一步解开 DNA 双链。
与引物结合,起始 DNA 复制。
(1) 单链结合蛋白(SSB 蛋白)
T4 噬菌体的 32kDa 蛋白可以结合单链 DNA , 它还能使双链 DNA 在远低于解链温度时分开。大部分原核 SSB 蛋白与 DNA 结合时还表现出协同效应:
如第一个 SSB 蛋白结合到 DNA 上去的能力为 1 , 第二个 SSB 结合能力则可高达 103 。SSB 蛋白的作用是稳定单链 DNA 。
(2) DNA 解链酶
大部分 DNA 解链酶都沿滞后链模板的 5 ’→3 ’方向并随着复制叉的前进而移动,只有 Rep 蛋白 沿前导链模板的 3 ’→5 ’方向移动。因此,Rep 蛋白和其他 DNA 解链酶分别在 DNA 的两条母链上协同作用,解开双链 DNA 。
(3) DNA 拓扑异构酶
消除解链造成的正超螺旋的堆积,使复制得以延伸。
2 . 复制的引发和终止
DNA 聚合酶只能延长已存在的 DNA 链,而不能从头合成 DNA 链,那么,新 DNA 的复制是怎样开始的呢?
研究发现,DNA 复制时,往往先由 RNA 聚合酶在 DNA 模板上合成一段 RNA 引物,再由 DNA聚合酶从 RNA 引物 3 ’端开始合成新的 DNA 链。
滞后链的引发过程比较复杂,需要多种蛋白质和酶的协同作用,还牵涉到冈崎片段的形成和连接。
滞后链的引发过程由引发体来完成。引发体由 6 种蛋白质 n、n ’、n ’’、Dna B 、C 和Ⅰ共同组成,只有当引发前体 把这 6 种蛋白质合在一起并与引发酶进一步组装后形成引发体,才能发挥其功能。
引发体在滞后链分叉的方向上前进,并在模板上间断性引发生成滞后链引物— RNA 短链,再由 DNA 聚合酶Ⅲ作用合成 DNA , 直至遇到下一个引物或冈崎片段为止。 由 RNase H 降解 RNA 引物并由 DNA 聚合酶 I 将缺口补齐,再由 DNA 连接酶将两个冈崎片段连在一起形成大分子 DNA 。
3 . 复制的终止
链的终止需要 Tus 蛋白参与
当复制叉前移,遇到 20bp 重复性终止子序列( Ter) 时,Ter - Tus 复合物能阻挡复制叉的继续前移,等到相反方向的复制叉到达后在 DNA 拓扑异构酶Ⅳ的作用下使复制叉解体,释放子链 DNA 。
4 . DNA 聚合酶
大肠杆菌中主要有 DNA 聚合酶Ⅰ 、Ⅱ 、Ⅲ 。
表 2 - 10 大肠杆菌 DNA 聚合酶Ⅰ、Ⅱ和Ⅲ的性质比较
DNA 聚合酶的共同点:
都以 dNTP 为底物
都需要 Mg2 + 激活
聚合时必须有模板链和具有 3 ′— OH 末端的引物链
链的延伸都方向为 5 ′→3 ′。
DNA 聚合酶Ⅰ 不是复制大肠杆菌染色体的主要聚合酶,它有 5 ’→3 ’核酸外切酶活性,保证了DNA 复制的准确性。它也可用来除去冈崎片段 5 ‘端 RNA 引物,使冈崎片段间缺口消失,保证连接酶将片段连接起来。
DNA 聚合酶Ⅱ的活性很低,若以每分钟酶促核苷酸掺入 DNA 的转化率计算,只有 DNA 聚合酶Ⅰ 的 5% , 所以也不是复制中主要的酶。 目前认为 DNA 聚合酶 Ⅱ的生理功能主要是起修复 DNA 的作用
DNA 聚合酶Ⅲ包含有 7 种不同的亚单位和 9 个亚基,其生物活性形式为二聚体。它的聚合活性 较强,为 DNA 聚合酶Ⅰ的 15 倍,聚合酶Ⅱ的 300 倍。它能在引物的 3 ’— OH 上以每分钟约 5 万个核苷酸的速率延长新生的 DNA 链,是大肠杆菌 DNA 复制中链延长反应的主导聚合酶。
二、真核生物 DNA 复制的的特点
真核生物 DNA 的复制子长约 150bp 左右,包括数个复制起始必需的保守区。
真核生物 DNA 复制叉的移动速度大约只有 50bp/秒。 因此,人类 DNA 中每隔 30 , 000 - 300 , 000bp 就有一个复制起始位点。
真核细胞中有 5 种 DNA 聚合酶,分别称为 DNA 聚合酶 α、β、γ、δ和 ε。
表 2 - 11 真核生物 DNA 聚合酶的特性比较
DNA 聚合酶 α主要参与引物合成
DNA 聚合酶 β活性水平稳定,主要在 DNA 损伤的修复中起作用。
DNA 聚合酶 δ是主要负责 DNA 复制的酶
DNA 聚合酶 ε的主要功能可能是在去掉 RNA 引物后把缺口补全
三、DNA 复制的调控
DNA 链延伸的速度在同种生物的不同细胞中几乎是恒定的,只是复制叉的数量不同。
迅速分裂的细胞具较多的复制叉,而分裂缓慢的细胞复制叉较少并出现复制的间隙。复制起始 频率的直接调控因子是蛋白质和 RNA 。
ColEl 质粒 DNA 的复制调控
ColEl 是一个 6646 碱基对的小质粒,在宿主细胞内有 20 ~ 30 个拷贝,其 DNA 的复制完全依靠宿 主 DNA 聚合酶。质粒 DNA 编码两个负调控因子 Rop 蛋白和反义 RNA( RNA1) , 它们控制了起始DNA 复制所必需的引物合成。
ColE1 质粒 DNA 复制起始部位调控因子之间关系
引物 RNA 前体的转录起始于复制起点上游,需经 RNaseH 加工后产生有 555 个核苷酸的引物,然后由 DNA 聚合酶 I 在引物的 3 ’末端起始 DNA 合成。
RNA1 的编码区在引物 RNA 编码区的 5 ’末端,转录方向与引物 RNA 相反,因此与引物 RNA 的 5 ’末端互补,并通过氢键配对与后者相互作用,阻止了 RNaseH 加工引物前体,使其不能转化为有活性的引物而对复制起调控作用。Rop 蛋白是 RNA1 基因转录的激活因子。
大肠杆菌染色体 DNA 的复制调控
染色体的复制与分裂一般是同步的,但二者并不直接偶联。
在一定生长速度范围内,细胞与染色体的质量之比相对恒定。
复制子由起始物位点和复制起点两部分组成。起始物位点编码复制体调节蛋白,复制起点与 调节蛋白相互作用并启动复制。调节蛋白通过与复制复合物的相互作用确定复制起始频率和复制方式
复制起点有 OriC 和 OriH 两种。
真核细胞 DNA 的复制调控
细胞生活周期水平调控(限制点调控):决定细胞停留在 G1 期还是进入 S 期
染色体水平调控:决定不同染色体或同一染色体不同部位的复制子按一定顺序在 S 期起始复制
复制子水平调控:决定复制的起始与否,并且是高度保守的。
第五节 DNA 的损伤修复
一、DNA 的损伤
a. sub stitutation(替换) b . deletion(缺失) c . insertion(插入) d . exon skipping
二、错配修复
由于染色体 DNA 在生命过程中占有至高无上的地位,DNA 复制的准确性以及 DNA 日常保养中的损伤修复就有着特别重要的意义。
大肠杆菌中 DNA 的修复系统
错配修复
错配修复对 DNA 复制忠实性的贡献力达 102 - 103 , DNA 子链中的错配几乎完全能被修正。
根据母链甲基化原则找出错配碱基的示意图
a. 发现碱基错配。
b . 在水解 ATP 的作用下,MutS , MutL 与碱基错配位点的 DNA 双链相结合。
c . MutS - MutL 在 DNA 双链上移动,发现甲基化 DNA 后由 MutH 切开非甲基化的子链。
该系统识别母链的依据来自 Dam 甲基化酶,它能使位于 5 ’GATC 序列中腺苷酸的 N6 位甲基化。一旦复制叉通过复制起始位点,母链就会在开始 DNA 合成前的几秒种至几分钟内被甲基化。
只要两条 DNA 链上碱基配对出问题,错配修复系统就会根据“保存母链,修正子链 ”的原则,找出 错误碱基所在的 DNA 链,并在对应于母链甲基化腺苷酸上游鸟苷酸的 5 ’位骆切开子链,再启动特定的修复途径,合成新的子链片段。
碱基错配修复过程示意图
当错配碱基位于切口 3 ’下游端时,在 MutL - MutS 、解链酶Ⅱ、DNA 外切酶Ⅶ或 RecJ 核酸酶的作用下从错配碱基 3 ’下游端开始切除单链 DNA 直到错配位点,并在 Pol Ⅲ和 SSB 的作用下合成新的子链片段。
若错配碱基位于切口的 5 ’上游端,则在 DNA 外切酶Ⅰ或Ⅹ的作用下切除单链 DNA 直到错配位点,再合成新的子链片段。
三、切除修复
切除修复有 2 种:碱基切除修复和核苷酸切除修复
所有细胞中都带有能识别受损核酸位点的不同的糖苷水解酶,能特异性切除受损核苷酸上的 N - β糖苷键,形成去嘌呤或去嘧啶位点,统称为 AP 位点。
DNA 分子中常见的几种核苷酸非酶促转变反应
a. 脱氨基反应
b . 脱嘌呤反应(N - β糖苷键被水解)
DNA 分子中一旦产生了 AP 位点,内切酶就会把受损核苷酸的糖苷 -磷酸键切开,移去 AP 位点 附近小片段 DNA , 并由 DNA 聚合酶 I 和 DNA 连接酶共同完成修复。
核苷酸切除修复
当 DNA 链上相应位置的核苷酸发生损伤,导致双链之间无法形成氢键,则由核苷酸切除修复系统负责修复。
DNA 分子中一旦产生了 AP 位点,内切酶就会把受损核苷酸的糖苷 - 磷酸键开,移去 AP 位点附近小片段 DNA , 并由 DNA 聚合酶 I 和 DNA 连接酶共同完成修复。
大肠杆菌和人类细胞中的核苷酸切除修复过程示意图
四、重组修复
重组修复又称为“复制后修复 ”。机体细胞对在复制起始后尚未修复的 DNA 损伤部位可以先复制再修复。
五、DNA 的直接修复
生物体内还存在 DNA 损伤直接修复而并不需要切除碱基或核苷酸的机制。DNA 光解酶能把在光下或经紫外光照射形成的环丁烷胸腺嘧啶二体及 6 - 4 光化物还原成为单体。
紫外光诱发形成嘧啶二体
此外,生物体内还广泛存在着使 O6 - 甲基鸟嘌呤脱甲基化的甲基转移酶。
第六节 DNA 的转座
一、转座子的分类和结构特征
DNA 的转座或称移位 , 是由可移位因子介导的遗传物质重排现象。
转座子是存在于染色体 DNA 上可自主复制和位移的基本单位。
转座子分为 2 大类:插入序列和复合式转座子。最简单的转座子不含有任何宿主基因而常被称 为插入序列( IS) , 它们是细菌染色体或质粒 DNA 的正常组成部分。一个细菌细胞常带有少于 10 个 IS 序列。
IS 因子:
常见的 IS 序列都是很小的 DNA 片段( 约 1kb) , 末端具有倒置重复序列,转座时常复制宿主靶位点 4 ~ 15bp 的 DNA 形成正向重复区。
大部分 IS 序列只有一个开放读码框,翻译起点紧挨着第一个倒置重复区,终止点位于第二个倒置重复区或附近。IS1 含有两个分开的读码框,只有移码通读才能产生功能型转座酶。
IS 序列的结构特征比较
复合式转座子:
复合式转座子是一类带有某些抗药性基因(或其他宿主基因)的转座子,其两翼往往是两个相同或高度同源的 IS 序列。
一旦形成复合转座子,IS 序列就不能再单独移动,因为它们的功能被修饰了,只能作为复合体 移动。
TnA 家族:
转座子 TnA 的结构示意图
除了末端带有 IS 序列的复合转座子以外,还存在一些没有 IS 序列的、体积庞大的转座子(5 000bp 以上)ℴTnA 家族。常带有 3 个基因,一个编码 β- 内酰胺 , 另两个则是转座作用 所必须的。所有 TnA 类转座子两翼都带有 38bp 的倒置重复序列。
二、转座作用的机制
转座发生时,受体分子中有一段很短的(3 ~ 12bp) 、被称为靶序列的 DNA 会被复制,使插入的转座子位于两个重复的靶序列之间。
不同转座子的靶序列长度不同,但特定转座子所复制的靶序列长度是一样的。IS1 两翼总有 9 个碱基对的靶序列,而 Tn3 两端总有 5bp 的靶序列。
在复制性转座中,整个转座子被复制,所移动的仅仅是原转座子的拷贝。转座酶和解离酶分别作用于原始及复制转座子。TnA 类主要是这种形式。
在非复制性转座中,原始转座子作为一个可移动的实体直接被移位,IS 序列、Mu 及 Tn5 等都以这种方式进行转座。
三、转座作用的遗传学效应
①转座引起插入突变,导致结构基因失活;
②转座产生新的基因;
③转座产生的染色体畸变;
④转座引起生物进化。
由于转座作用,使某些原来在染色体上相距甚远的基因组合到一起,构建成新的表达单元,产生新的基因和蛋白质分子。
四、真核生物中的转座子
1 . 玉米中的控制因子
玉米中转座子的控制因子分为两类,即自主性因子和非自主性因子。前者具有自主剪接和转座 的功能;后者单独存在时是稳定的,不能转座,当基因组中存在与非自主性因子同家族的自主性因子时,它才具备转座功能。同一家族的自主性因子能为非自主性因子的转座提供反式作用蛋白( 转座酶)。
玉米中比较清楚的 2 个控制因子:Ac - Ds 系统(激活-解离系统)和 Spm - dSpm
在 Ac - Ds 体系中,自主转座子 Ac 长 4 563bp , 转录生成 3 500bp 的单一成熟 RNA 。Ac 转座子的 两翼有 11bp 的倒转重复序列,在其靶 DNA 位点复制形成 8bp 正向重复。
已知所有 Ds 都是 Ac 转座子的缺失突变体,其两端有完整的转座特征序列
Spm和 En 属于另一类转座子。Spm 和 En 几乎是完全相同的,它们只有不到 10 个碱基的差异,两端各有一个 13bp 的倒置重复序列,在其靶 DNA 位点复制形成 3bp 正向。
Spm 和 En 的转录区(即tnpA 基因)有 8300bp , 成熟 mRNA 为 2500bp 。tnpA 基因产物的主要功能 是切割转座子序列。另有两个开放读码框位于 tnpA 基因的内含子中,其 mRNA 的含量大约只有tnpA 基因产物的 1% 。 由 tnpB 基因编码的这两个蛋白可能直接与转座子两端 13bp 倒转重复区相结合,有利于 DNA 的切割和转移。所有 dSpm都是功能型 Spm 的缺失突变体
2 . 果蝇中的转座子
Copia 转座子
果蝇中的 Copia 转座子具有数百 bp 的末端正向重复和类似于酵母 Ty 转座子及 RNA 肿瘤前病毒 的结构,能以高速度转录并产生有多聚腺苷化末端的 RNA 。只具有一个长的可阅读框架,基因产物与RNA 肿瘤病毒逆转录酶有较高的同源性
真核生物细胞内存在不少结构上类似于反转录病毒的反转录转座子。这类转座子都编 码一个与反转录病毒中的反转录酶高度同源的转座酶,左右两边都是与病毒边界序列 LTR 同源的重复序列。
P 转座子
属于非复制型,两翼都有 31bp 倒置重复序列,转座后导致靶 DNA 复制产生 8bp 正向重复序列。有实验证明,P 转座子插入果蝇基因组 W 位点引起杂种不育。
第三章 生物信息的传递(上)— 从 DNA 到 RNA
第 一 节 RNA 的转录
Crick 的中心法则
㇏
一、RNA 转录的基本过程
二、转录机器的主要成分
第 二 节 启动子与转录起始
大肠杆菌 RNA 聚合酶与启动子的相互作用主要包括启动子区的识别、酶与启动子的结合及 σ因 子的结合与解离
一、启动子区的基本结构
启动子是一段位于结构基因 5 ’端上游区的 DNA 序列,能活化 RNA 聚合酶,使之与模板 DNA 准确地相结合并具有转录起始的特异性。
转录的起始是基因表达的关键阶段,而这一 阶段的重要问题是 RNA 聚合酶与启动子的相互作用。启动子的结构可以影响它与 RNA 聚合酶的亲和力,从而影响基因表达的水平。
转录单元是一段从启动子开始至终止子结束的 DNA 序列。
转录起点是指与新生 RNA 链第一个核苷酸相对应 DNA 链上的碱基,通常为嘌呤。把起点 5 ′末 端的序列称为上游 , 而把其 3 ′末端的序列称为下游。起点为 + 1 , 下游方向依次为 + 2 、+ 3 … …等,上游方向依次为 1 、 2 、 3 … …等等。
启动子区的结构特点:
将 RNA 聚合酶全酶与模板 DNA 结合后,用 DNaseI 降解 DNA , 得到 41 ~ 44 个核苷酸对的 DNA 片 段。序列分析发现,在被保护区内有一个由 5 个核苷酸组成的保守序列,是聚合酶结合位点,称为Pribnow 区,其中央大约位于起点上游 10bp 处,所以又称为 —10 区。
转录启动子区 DNA 序列的分离纯化过程图示
科学家又从噬菌体的左、右启动子 PL 及 PR 和 SV40 启动子的 35bp 附近找到了另一段共同序列:TTGACA 。
现已证实大部分启动子都存在这两段共同序列,即位于10bp 处的 TATA 区和35 bp 处的 TT-GACA 区。它们是 RNA 聚合酶与启动子的结合位点。
在真核生物基因中,Hogness 等发现类似 Pribnow 区的 Hogness 区,在转录起始点上游 25 ~ 30 bp 处,保守序列为 TATAAA , 也称 TATA 区。在起始位点上游 70 ~78 bp 处还有另一段共同序列 CCAAT , 称为 CAAT 区。
真核生物 RNA 聚合酶Ⅱ所识别的启动子区
二、- 10 区与 - 35 区的最佳间距
如果把 Pribnow 区从 TATAAT 变成 AATAAT 就会使该启动子发生下降突变;如果增加 Pribnow 区 的共同序列,将乳糖操纵子的启动子中的 TATGTT 变成 TATATT , 就会提高启动子的效率,称为上升突变。
三、增强子及其功能
已在 SV40 的转录单元上发现其转录起始位点上游约 200bp 处有两段 72bp 长的重复序列,它们 不是启动子的一部分,但能增强或促进转录的起始,因此,称这种能强化转录起始的序列为增强子或强化子。
真核基因的启动子在 25 ~ 35 区含有 TATA 序列,在 70 ~ 80 区含有 CCAAT 序列。在80 ~ 110 含有 GCCACACCC 或 GGGCGGG 序列。习惯上,将 TATA 区上游的保守序列称为上游启动子元件UPE或称上游激活序列UAS)。
TATA 区的主要作用是使转录精确地起始。如果除去 TATA 区或进行碱基突变,转录产物下降的 相对值不如 CAAT 区或 GC 区突变后明显,但发现所获得的 RNA 产物起始点不固定。研究 SV40 晚期 基因启动子发现,上游激活区的存在与否,对该启动子的生物活性有着根本性的影响。若将该基因 5 ′上游 21 ~ 47 核苷酸序列切除,基因完全不表达。
CAAT 区和 GC 区主要控制转录起始频率,基本不参与起始位点的确定。
SV40 的早期基因,缺少 TATA 和 CAAT 区,只有 6 个串联在上游 40 ~110 位点的 GC 区;而组蛋白 H2B , 不含 GC 区,但有两个 CAAT 区,一个 TATA 区。研究发现,真核细胞中存在着大量特异 性或组成性表达的、能够与不同基因启动子区 UPE 相结合的转录调控因子
真核细胞中的部分转录调控因子分析
第 三 节 原核与真核生物 m RNA 的特征比较
一、原核生物 mRNA 的特征
半衰期短
原核生物中,mRNA 的转录和翻译是在同一个细胞空间里同步进行的,蛋白质合成往往在 mRNA刚开始转录时就被引发了。
大多数细菌 mRNA 在转录开始 1 分钟后就开始降解。mRNA 降解的速度大概只有转录或翻译速度的一半。科学家发现每过大约 2 分钟,体系中出现新生蛋白质的速度就下降 50% 。
许多原核生物 mRNA 可能以多顺反子的形式存在
我们把只编码一个蛋白质的 mRNA 称为单顺反子 mRNA , 把编码多个蛋白质的 mRNA 称为多顺反子 mRNA 。
几乎所有 mRNA 都可以被分成 3 部分:(1)编码区(2)位于 AUG 之前的 5 ’端上游非编码区(3) 位于终止密码子之后不翻译的 3 ’端下游非编码区。编码区从起始密码子 AUG 开始经一连串编码氨基酸的密码子直至终止密码子。
第一个蛋白质合成终止以后,核糖体分解成大、小亚基,脱离 mRNA 模板,第二个蛋白的翻译必须 等到新的小亚基和大亚基与该蛋白起始密码子相结合后才可能开始
前一个多肽翻译完成以后,核糖体大、小亚基分离,小亚基也可能不离开 mRNA 模板,而是迅速与 游离的大亚基结合,启动第二个多肽的合成 。
原核生物 mRNA 的 5 ’端无帽子结构,3 ’端没有或只有较短的 poly A 结构
原核生物起始密码子 AUG 上游 7 - 12 个核苷酸处有一被称为 SD 序列的保守区,因为该序列与 16S - rRNA 3 ’端反向互补,所以被认为在核糖体 - mRNA 的结合过程中起作用。
二、真核生物 mRNA 的特征
真核生物 mRNA 的 5 ’端 “帽子”结构
真核生物基因转录一般从嘌呤(主要是 A , 也可能是 G) 起始,其 5 ’端大都经过修饰,第一个核苷酸保留了 5 ’端的三磷酸基团。
用核酸酶处理成熟 mRNA , 其 5 ’端并不产生预期的核苷三磷酸,而产生以 5 ’- 5 ’三磷酸基团相 连的二核苷酸,5 ’终端是一个在 mRNA 转录后加上去的甲基化鸟嘌呤
mRNA 的帽子结构常常被甲基化。第一个甲基出现在所有真核细胞的 mRNA 中(单细胞真核生 物 mRNA 主要是这个结构),由尿苷酸 - 7 甲基转移酶催化,称为零类帽子( cap0 ) 。
如在第二个核苷酸(原 mRNA 5 ’第一位)的 2 ’- OH 位上加另一个甲基,这步反应由 2 ’- O - 甲基转移酶完成。一般把有这两个甲基的结构称为 1 类帽子( cap1 ) , 真核生物中以这类帽子结构为主。
当 mRNA 原第二位核苷酸是腺嘌呤时,其 N6 位有时也被甲基化,这一反应只能在 2 ’- OH 被甲基化以后才能发生。
在某些生物细胞内,mRNA 链上的第三个核苷酸的 2 ’- OH 位也可能被甲基化,因为这个反应只以带有 1 类帽子的 mRNA 为底物,所以被称为 2 类帽子( cap2 ) 。有 2 类帽子的 mRNA 只占有帽 mR-NA 总量的 10% - 15% 以下。
绝大多数真核生物 mRNA 具有 poly A 尾巴
除组蛋白基因外,真核生物 mRNA 的 3 ’末端都有 poly A 序列,其长度因 mRNA 种类不同而变化, 一般为 40 - 200 个左右。真核基因的 3 ‘末端转录终止位点上游 15 ~ 30bp 处的保守序列 AAUAAA 对于初级转录产物的准确切割及加 poly A 是必需的)
真核生物 mRNA 中的加多聚 A 反应
poly A 是 mRNA 由细胞核进入细胞质所必需的形式,它大大提高了 mRNA 在细胞质中的稳定性。
mRNA 刚从细胞核进入细胞质时,其 poly A 尾巴一般比较长.随着 mRNA 在细胞质内逗留时间延长,poly A 逐渐变短消失,mRNA 进入降解过程
第 四 节 终止和抗终止
RNA 聚合酶启始基因转录后,就沿模板 5 ’→3 ’方向不停地移动,合成 RNA 链直到碰上终止信号时才与模板 DNA 相脱离并释放新生 RNA 链。所有参与形成 RNA - DNA 杂合体的氢键都被破坏,模板 DNA 链与有意义链重新组合成 DNA 双链。
一、不依赖于 ρ因子的终止
终止位点上游一般有一个富含 GC 碱基的二重对称区,由这段 DNA 转录产生的 RNA 容易形成发 卡式结构。在终止位点前面有一段由 4 - 8 个 A 组成的序列,所以转录产物的 3 ’端为寡聚 U , 这种结 构特征的存在决定了转录的终止。
新生 RNA 中出现发卡式结构会导致 RNA 聚合酶的暂停,破坏 RNA - DNA 杂合链 5 ’端的正常结 构。寡聚 U 的存在使杂合链的 3 ’端部分出现不稳定的 rU . dA 区域,两者共同作用使 RNA 从三元复 合物中解离出来
由基因序列决定的转录终止过程示意图
终止效率与二重对称序列和寡聚 U 的长短有关,随着发卡式结构(至少 6bp)和寡聚 U 序列(至少4 个 U)长度的增加,终止效率逐步提高。
二、依赖于 ρ因子的终止
提纯的 RNA 聚合酶并不能识别特异性的转录终止信号,而加入大肠杆菌 ρ因子后该聚合酶就能 在 DNA 模板上准确地终止转录。ρ因子是一个相对分子质量为 2 . 0 ×10 5 的六聚体蛋白,它通过催化NTP 的水解促使新生 RNA 链从三元转录复合物中解离。
RNA 合成起始以后,ρ因子即附着在新生的 RNA 链上,靠 ATP 水解产生的能量,沿着 5 ’→3 ’方 向朝 RNA 聚合酶移动,到达 RNA 的 3 ’- OH 端后取代了暂停在终止位点上的 RNA 聚合酶,使之从模板 DNA 上释放 mRNA , 完成转录过程
第五节 内含子的剪接、编辑、再编码及化学修饰
一、RNA 中的内含子
因为真核基因表达往往伴随着 RNA 的剪接过程 , 从 mRNA 前体分子中切除被称为内含子(intron )的非编码区,并使基因中被称为外显子的编码区拼接形成成熟 mRNA
用 DNA - RNA 杂交的方法验证鸡卵清蛋白基因中存在非编码的内含子区
a. 成熟 mRNA 与带有该基因的互补链 DNA 序列杂交示意图;
真核基因大多是断裂的,也就是说,一个基因可由多个内含子和外显子间隔排列而成。研究表明,内含子在真核基因中所占的比例很高,甚至超过 99%
部分人类基因中内含子序列所占的比重分析
由 DNA 转录生成的原始转录产物—核不均一 RNA , 即 mR-NA 的前体,经过 5 ’加“帽 ”和 3 ’酶切加多聚腺苷酸,再经过 RNA 的剪接,编码蛋白质的外显子部分就连接成为一个连续的可译框ORF, 通过核孔进入细胞质,作为蛋白质合成的模板。 RNA 加工过程及其生理功能和原始转录产物的生成及其主要加工剪接过程图示分别总结了原始 RNA 成熟期间的主要加工过程
真核基因平均含有 8 - 10 个内含子,前体分子一般比成熟 mRNA 大 4 - 10 倍。
内含子的“功能 ”及其在生物进化中的地位是一个引人注目的问题。
许多人类疾病是内含子剪接异常引起的。地中海贫血病人的珠蛋白基因中,大约有 1 /4 的核苷酸突变发生在内含子的 5 ’或 3 ’边界保守序列上,或者直接干扰了前体 mRNA 的正常剪接
二、mRNA 的剪接
由 U1 snoRNA 以碱基互补的方式识别 mRNA 前体 5 ’剪接点,由结合在 3 ’剪接点上游富嘧啶区的 U2AF 识别 3 ’剪接点并引导 U2 snRNP 与分支点相结合,形成剪接前体。
剪接前体进一步与 U4 、U5 、U6 snRNP 三聚体相结合,形成 60S 的剪接体( spliceosome) , 进行 RNA前体分子的剪接
在高等真核生物个体发育或细胞分化过程中可以有选择性地越过某些外显子或某个剪接点进行变位剪接,产生出组织或发育阶段特异性 mRNA , 称为内含子的变位剪接。
脊椎动物中大约有 5% 的基因能以这种方式进行剪接,保证各同源蛋白质之间既具有大致相同的结构或功能域,又具有特定的性质差异,进而拓展了基因所携带的遗传信息。
生物体内的各种内含子
三、RNA 编辑、再编码及化学修饰
RNA 的编辑
RNA 的再编码
mRNA 在某些情况下不是以固定的方式被翻译,而可以改变原来的编码信息,以不同的方式进行 翻译,把 RNA 编码和读码方式的改变称为 RNA 的再编码 。
RNA 的化学修饰
除了 RNA 的编辑之外,有些 RNA , 特别是前体 rRNA 和 tRNA , 还可能有特异性化学修饰。
研究证实,仅人细胞内 rRNA 分子上就存在 106 种甲基化和 95 种假尿嘧啶产物,虽然尚未发现特征性保守序列,但有实验证据表明,RNA 的化学修饰可能具有位点特异性。
有实验表明,分子量只有 70 - 100 个核苷酸的核仁 RNA 参与 RNA 的化学修饰,因为 这些 RNA 能通过碱基配对的方式,把 rRNA 分子上需要修饰的位点找出来
第四章 生物信息的传递(下)— 从 mRNA 到蛋白质
第一节 遗传密码—三联子
所谓翻译是指将 mRNA 链上的核苷酸从一个特定的起始位点开始,按每 3 个核苷酸代表一个氨 基酸的原则,依次合成一条多肽链的过程。这 3 个核苷酸就是一个密码子。翻译从起始密码子 AUG 开始,沿 mRNA 5 ‘→3 ’方向连续阅读密码子,直至终止密码子为止,生成一条具有特定序列的多肽链—蛋白质
一、三联子密码及其破译
Crick 关于tRNA 分子破译 mRNA 遗传密码三联子的原始构想
因为 mRNA 中只有 4 种核苷酸,而蛋白质中有 20 种氨基酸,以一种核苷酸代表一种氨基酸是不 可能的。若以两种核苷酸作为一个氨基酸的密码( 二联子),它们能代表的氨基酸也只有 42 = 16 种。若以 3 个核苷酸代表一个氨基酸,有 43 = 64 种密码子,满足了编码 20 种氨基酸的需要。
Crick 等人发现 T4 噬菌体某位点上两个基因的正确表达与它能否侵染大肠杆菌有关,用吖啶类试剂(诱导核苷酸插入或从 DNA 链上丢失)处理使 T4 噬菌体 DNA 发生移码突变,噬菌体就丧失感染力。
若在模板 mRNA 中插入或删除一个碱基,会改变该密码子以后的全部氨基酸序列。若同时对模 板进行插入和删除试验,保证后续密码子序列不变,翻译得到的蛋白质序列就保持不变除了发生突变的那个密码子所代表的氨基酸之外。
图见视频
一次删去 5 ’- GUA ↓ ↓ ↓ UAC GGA U … … …3 ’
图 4 - 2 用核苷酸的插入或删除实验证明 mRNA 模板上每三个核苷酸组成一个密码子对烟草坏死卫星病毒的研究发现,其外壳蛋白亚基由 400 个氨基酸组成,而相应的 RNA 片段长约 1 200 个核苷酸,与假设的密码三联子体系正好相吻合。
核糖体结合技术
以人工合成的三核苷酸如 UUU 、UCU 、UGU 等为模板,在含核糖体、AA - tRNA 的适当离子强度的 反应液中保温后通过硝酸纤维素滤膜。游离的 AA - tRNA 因相对分子质量小能自由过膜,与模板对 应的 AA - tRNA 能与核糖体结合,体积超过膜上的微孔而被滞留。
若用 20 种 AA - tRNA 做 20 组同样的实验,每组都含 20 种 AA - tRNA 和各种三核苷酸,但只有 一种氨基酸用 14C 标记,看哪一种 AA - tRNA 被留在滤膜上,进一步分析这一组的模板是哪个三核苷 酸,从模板三核苷酸与氨基酸的关系可测知该氨基酸的密码子。
三核苷酸密码子能使特定的氨基酰 - tRNA 结合到核糖体上
数字代表特定氨基酰tRNA 与带有模板三核苷酸的核糖体相结合的效率
二、遗传密码的性质
密码的简并性
4 种核苷酸可组成 64 个密码子,其中 61 个是编码氨基酸的密码子,另外 3 个即 UAA、UGA 和 UAG 并不代表任何氨基酸,它们是终止密码子,不能与 tRNA 的反密码子配对,但能被终止因子或释放因子识别,终止肽链的合成
9 种氨基酸有 2 个密码子,1 种氨基酸有 3 个密码子,5 种氨基酸有 4 个密码子,3 种氨基酸有 6个密码子
由一种以上密码子编码同一个氨基酸的现象称为简并, 对应于同一氨基酸的密码子称为同义密码子
AUG 和 GUG 既是甲硫氨酸及缬氨酸的密码子又是起始密码子
密码子与反密码子的相互作用
tRNA 的反密码子在核糖体内是通过碱基的反向配对与 mRNA 上的密码子相互作用的。Crick 提出摆动假说,解释了反密码子中某些稀有成分(如Ⅰ)的配对,以及许多氨基酸有 2个以上密码子的问题。
在密码子与反密码子的配对中,前两对严格遵守碱基配对原则,第三对碱基有一定的自由度,可 以“摆动 ”,因而使某些 tRNA 可以识别 1 个以上的密码子。一个 tRNA 究竟能识别多少个密码子是由 反密码子的第一位碱基的性质决定的,反密码子第一位为 A 或 C 时只能识别 1 种密码子,为 G 或 U时可以识别 2 种密码子,为Ⅰ 时可识别 3 种密码子。
多个密码子同时编码一个氨基酸,凡是第一、二位碱基不同的密码子都对应于各自独立的 tRNA 。
原核生物中大约有 30 - 45 种 tRNA ,真核细胞中可能存在 50 种 tRNA
第二节 tRNA
一、tRNA 的三级结构
tRNA 不但为每个三联密码子翻译成氨基酸提供了接合体,还为准确无误地将所需氨基酸运送到 核糖体上提供了运送载体,所以,它又被称为第二遗传密码。
不同 tRNA 在结构上存在大量的共性,由小片段碱基互补配对形成三叶草形分子结构,有 4 条根 据结构或已知功能命名的手臂。
图见视频
最常见 tRNA 分子有 76 个碱基,相对分子质量约为 2 . 5 ×104,不同的 tRNA 分子可有 74 ~ 95 个 核苷酸不等。
受体臂由链两端序列配对形成的杆状结构和 3 ‘端未配对的 3 ~ 4 个碱基所组成,其 3 ’端的最后 3 个碱基序列永远是 CCA ,最后一个碱基的 3 ’或 2 ’自由羟基( — OH)可以被氨酰化。
T ψC 臂是根据 3 个核苷酸命名的,其中 ψ表示拟尿嘧啶;反密码子臂是根据位于套索中央的三联反密码子命名的。
D 臂是根据它含有二氢尿嘧啶命名的。
tRNA 的稀有碱基含量非常丰富,约有 70 余种。每个 tRNA 分子至少含有 2 个稀有碱基,最多有19 个,多数分布在非配对区,特别是在反密码子 3 ′端邻近部位出现的频率最高。
酵母 tRNAphe 的三级结构示意图
根据 X - 射线衍射数据绘制)a 和 b 表示用不同方法构建的模型。
在 L 形三级结构中,受体臂和 T ψC 臂的杆状区域构成了第一个双螺旋,D 臂和反密码子臂的杆 状区域形成了第二个双螺旋。TψC 臂和 D 臂的套索状结构位于“L ”的转折点,受体臂顶端的碱基位 于“L ”的一个端点,反密码子臂的套索状结构生成了“L ”的另一个端点。
tRNA 上所运载的氨基酸必须靠近位于核糖体大亚基上的多肽合成位点,而 tRNA 上的反密码子 必须与小亚基上的 mRNA 相配对,所以分子中两个不同的功能基团是最大限度分离的
二、tRNA 的功能
只有 tRNA 上的反密码子能与 mRNA 上的密码子相互识别并配对,氨基酸本身不能识别密码子, 只有结合到 tRNA 上生成 AA - tRNA , 才能被带到 mRNA - 核糖体复合物上,插入到正在合成的多肽链的适当位置上。
用 14C 标记的表明起识别作用的是 tRNA 。
三、tRNA 的种类
1 . 起始 tRNA 和延伸 tRNA
能特异性识别 mRNA 模板上起始密码子的 tRNA 叫起始 tRNA , 其他 tRNA 统称为延伸 tRNA 。真 核生物起始 tRNA 携带甲硫氨酸( Met ) , 原核生物起始 tRNA 携带甲酰甲硫氨酸( fMet ) , Met - tR- NAfMet 必须首先甲酰化生成 fMet - tRNAfMet 才能参与蛋白质的生物合成。
2 . 同工 tRNA
将代表相同氨基酸的不同 tRNA 称为同工 tRNA 。在一个同工 tRNA 组内,所有 tRNA 均专一于相 同的氨基酰 - tRNA 合成酶。同工 tRNA 既要有不同的反密码子以识别该氨基酸的各种同义密码,又 要有某种结构上的共同性,能被 AA - tRNA 合成酶识别。
3 . 校正 tRNA
结构基因中某个核苷酸的改变可能产生终止密码子( UAG、UGA、UAA ) , 使蛋白质合成提前终止,合成无功能的或无意义的多肽,这种突变称为无义突变,而校正 tRNA 通过改变反密码子区校正无义突变
四、氨酰 - tRNA 合成酶
AA - tRNA 合成酶是一类催化氨基酸与tRNA 结合的特异性酶,其反应式如下: AA + tRNA + ATP→ AA - tRNA + AMP + PPi
包括两步反应:
第一步是氨基酸活化生成酶-氨基酰腺苷酸复合物。
AA + ATP + 酶(E ) →E - AA - AMP + PPi
第二步是氨酰基转移到 tRNA3 ′末端腺苷残基的 2 ′或 3 ′- 羟基上。
E - AA - AMP + tRNA→AA - tRNA + E + AMP
第三节 核糖体
一、核糖体的结构
核糖体是由几十种蛋白质和多种核糖体 RNA( ribosomal RNA , rRNA )所组成的亚细胞颗粒。
核糖体蛋白约占原核细胞总蛋白量的 9 - 10% , 占细胞内总 RNA 量的 70 - 80% 。在真核细胞内,核糖体所占的比重虽然有所下降,但仍然占总 RNA 的绝大部分,是细胞总蛋白的一个重要组成部分。
核糖体及其他组分在大肠杆菌细胞内的分布
大肠杆菌核糖体基本成分
原核生物核糖体由约 2/3 的 RNA 及 1 /3 的蛋白质组成。真核生物核糖体中 RNA 占 3/5 , 蛋白质 占 2/5 。原核生物、真核生物细胞质及细胞器中的核糖体存在着很大差异
5SrRNA
细菌 5SrRNA 含有 120 个核苷酸(革兰氏阴性菌)或 116 个核苷酸(革兰氏阳性菌)。 5SrRNA 有两个高度保守的区域,其中一个区域含有保守序列 CGAAC , 这是与tRNA 分子 TψC 环 上的 GTψCG 序列相互作用的部位,是 5S rRNA 与 tRNA 相互识别的序列。
16SrRNA
长约 1 475 ~ 1 544 个核苷酸之间,含有少量修饰碱基,位于 30S 小亚基内。16SrRNA 的结构十分 保守,其中 3 ‘端一段 ACCUCCUUA 的保守序列,与 mRNA5 ’端翻译起始区中的 SD 序列互补。 16SrRNA 靠近 3 ′端处还有一段与 23S rRNA 互补的序列,在 30S 与 50S 亚基的结合中起作用。
23SrRNA
23SrRNA 基因有 2 904 个核苷酸,1984 ~ 2001 核苷酸之间存在能与 tRNAMet 序列互补的片段,表 明核糖体大亚基 23SrRNA 可能与 tRNAMet 的结合有关。第 143 ~ 157 位核苷酸之间有一段 12 个核苷 酸的序列与 5S rRNA 上第 72 ~ 83 位核苷酸互补,表明在 50S 大亚基上这两种 RNA 之间可能存在相 互作用。
在多肽合成过程中,由不同的 tRNA 将相应的氨基酸带到蛋白质合成部位,并与 mRNA 进行专一 性的相互作用,以选择对信息专一 的 AA - tRNA 。核糖体还必须能同时容纳另一种携带肽链的 tRNA , 即肽基 tRNA(peptidyl - tRNA) , 并使之处于肽键易于生成的位置上
二、核糖体的功能
核糖体上至少有 5 个活性中心,即 mRNA 结合部位、结合或接受 AA - tRNA 部位(A 位)、结合或接受肽基 tRNA 的部位、肽基转移部位(P 位)及形成肽键的部位(转肽酶中心)。此外,还应有负责肽链延伸的各种延伸因子的结合位点
核糖体小亚基负责对模板 mRNA 进行序列特异性识别,大亚基负责携带氨基酸及 tRNA 的功能, 肽键的形成、AA - tRNA、肽基 - tRNA 的结合等,A 位、P 位、转肽酶中心等主要在大亚基上
第四节 蛋白质合成的生物学机制
核糖体是蛋白质合成的场所,mRNA 是蛋白质合成的模板,转移 RNA 是模板与氨基酸之间的接合体。蛋白质合成是一个需能反应。真核生物中可能有近 300 种生物大分子参与蛋白质的生物合成,这些组分约占细胞干重的 35% 。
细胞用来进行合成代谢总能量的 90% 消耗在蛋白质合成过程中。大肠杆菌只需要 5 - 6 秒钟就 能合成一条由 100 个氨基酸组成的多肽。蛋白质的生物合成包括氨基酸活化、肽链的起始、延伸、终止以及新合成多肽链的折叠和加工
一、氨基酸的活化
高等动物不能合成大约一半氨基酸,只能从食物中获取这些必需氨基酸。
参与蛋白质合成的 20 种氨基酸主要特征分析
二、翻译的起始
蛋白质合成的起始是指在模板 mRNA 编码区 5 ‘端形成核糖体 - mRNA - 起始 tRNA 复合物并将 甲酰甲硫氨酸放入核糖体 P 位点。
原核生物中 30S 小亚基首先与 mRNA 模板相结合,再与 fMet - tRNAfMet 结合,最后与 50S 大亚基 结合。 真核生物中,40S 小亚基首先与 Met - tRNAMet 相结合,再与模板 mRNA 结合,最后与 60S 大亚基 结合生成 80S·mRNA·Met - tRNAMet 起始复合物。起始复合物的生成除了 GTP 外,还需要 Mg2 + 、 NH4 + 及 3 个起始因子(IF - 1 、IF - 2 、IF - 3 )
翻译起始合物的形成
第一步,30S 小亚基与翻译起始因子 IF - 1 , IF - 3 结合,通过 SD 序列与 mRNA 模板相结合。
第二步,fMet - tRNAfMet 在 IF - 2 的协同下进入小亚基的 P 位,tRNA 上的反密码子与 mRNA 上的起始密码子配对。
第三步,带有 tRNA、mRNA、三个翻译起始因子的小亚基复合物与 50S 大亚结合,释放翻译起始因子。
30S 亚基具有专一性的识别和选择
mRNA 起始位点的性质,IF3 协助该亚基完成这种选择。几乎所有原核生物 mRNA 上都有一个 5 ’- AGGAGGU - 3 ’序列,这个富嘌呤区与 30S 亚基上 16S rRNA3 ’末端的富嘧啶区 5 ’- GAUCAC - CUCCUUA - 3 ’相互补。
细菌核糖体上一般存在三个与氨基酰 - tRNA 结合的位点,即 A 位点 , P 位点和 E 位点( 。只有 fMet - tRNAfMet 能与第一个 P 位点相结合,其它所有 tRNA 都必须通过 A 位点到达 P 位点,再由 E 位点离开核糖体。
真核生物蛋白质生物合成的起始基本与原核生物相同,只不过其核糖体较大,有较多的起始因 子,mRNA 具有m7GpppNp 帽子结构,Met - tRNAMet 不甲酰化,mRNA 分子 5 ’端的“帽子 ”和 3 ’端的 多聚 A 都参与形成翻译起始复合物
三、翻译的延伸
生成起始复合物,第一个氨基酸与核糖体结合以后,肽链开始伸长。按照 mRNA 模板密码子的排列,氨基酸通过新生肽键的方式被有序地结合上去。肽链延伸中的 每个循环都包括 AA - tRNA 与核糖体结合、肽键的生成和移位三步。
后续 AA - tRNA 与核糖体结合
图见视频
细菌中肽链延伸的第一步反应:第二个氨基酰 - tRNA 的结合。该氨基酰 - tRNA 首先与 EF - Tu · GTP 形成复合物,进入核糖体的 A 位,水解产生 GDP 并在 EF - Ts 的作用下释放 GDP 并使 EF - Tu 结合另一分子 GTP , 进入新一轮循环
肽键的生成
图见视频
细菌中肽链延伸的第二步反应:肽键的生成。
在核糖体·mRNA·AA - tRNA 复合物中,AA - tRNA 占据 A 位,fMet - tRNAfMet 占据 P 位。在肽基转移酶的催化下,A 位上的 AA - tRNA 转移到 P 位,与 fMet - tR- NAfMet 上的氨基酸生成肽键。
起始 tRNA 在完成使命后离开核糖体 P 位点,A 位点准备接受新的 AA - tRNA , 开始下一轮合成反应。
移位
肽键延伸的最后一步是移位,即核糖体向 mRNA 3 ’端方向移动一个密码子。
图见视频
延伸的第三步反应:移位核糖体通过 EF - G 介导的 GTP 水解所提供的能量向 mRNA 模板 3 ’末 端移动一个密码子,使二肽基 - tRNA 完全进入 P 位,准备开始新一轮肽链延伸。
用嘌呤霉素作为抑制剂做实验表明,核糖体沿 mRNA 移动与肽基 - tRNA 的移位这两个过程是耦 联的。肽链延伸是由许多个这样的反应组成的,原核生物中每次反应共需 3 个延伸因子,EF - Tu、EF - Ts 及 EF - G , 真核生物细胞需 EF - 1 及 EF - 2 , 消耗 2 个 GTP , 向生长中的肽链加上一个氨基酸。
四、翻译的终止
当终止密码子 UAA 、UAG 或 UGA 出现在核糖体的 A 位时,没有相应的 AA - tRNA 能与之结合, 而释放因子能识别这些密码子并与之结合,水解 P 位上多肽链与 tRNA 之间的二酯键,释放新生的肽链和 tRNA , 核糖体束。释放因子 RF 具有 GTP 酶活性,它催化 GTP 水解,使肽链与核糖体解离。
细菌细胞内存在三种终止因子( 或称释放因子,RF1 , RF2 , RF3) , RF1 能识别 UAG 和 UAA , RF2识别 UGA 和 UAA 。一旦 RF 与终止密码相结合,它们就能诱导肽基转移酶把一个水分子而不是氨基酸加到延伸中的肽链上。RF3 可能与核糖体的解体有关。
真核细胞只有一个(RF)终止因子。
第五节 蛋白质运转机制
一、蛋白质的前体加工
新合成的胰岛素前体是前胰岛素原,必须先切去信号肽变成胰岛素原,再切去 C - 肽,才变成 有活性的胰岛素
脊髓灰质炎病毒的 mRNA 可翻译成很长的多肽链,含多种病毒蛋白,经蛋白酶在特定位臵上水解后得到几个有功能的蛋白质分子。
不少多肽类激 素 和 酶 的 前 体 如 血 纤 维 蛋 白 原 、胰 蛋 白 酶 原 都 要 经 过 加 工 才 能 变 为 活 性 分子 。
N 端 fMet 或 Met 的切除
无论原核生物还是真核生物,N 端的甲硫氨酸往往在多肽链合成完毕前就被切除。50% 的真核 蛋白中,成熟蛋白 N 端残基会被 N - 乙基化。
二硫键的形成
mRNA 中没有胱氨酸密码子,而不少蛋白质都含有二硫键。蛋白质合成后往往通过两个半胱氨 酸的氧化作用生成胱氨酸。
特定氨基酸的修饰
氨基酸侧链的修饰作用包括磷酸化(如核糖体蛋白质)、糖基化(如各种糖蛋白)、甲基化(如组蛋 白、肌肉蛋白质)、乙基化(如组蛋白)、羟基化(如胶原蛋白)和羧基化等
二、蛋白质的合成抑制
蛋白质生物合成的抑制剂主要是一些抗生素,如嘌呤霉素 、链霉素 、四环素 、氯霉素 、红霉素 等 。5 - 甲基色氨酸 、环已亚胺 、白喉毒素 、蓖麻蛋白和其他核糖体灭活蛋白都能抑制蛋白质的合成 。
链霉素是一种碱性三糖,能干扰 fMet - tRNA 与核糖体的结合,从而阻止蛋白质合成的正确起 始,也会导致 mRNA 的错读。若以多聚(U )作模板,则除苯丙氨酸(UUU)外,异亮氨酸(AUU)也会被 掺入。
链霉素的作用位点在 30S 亚基上。
嘌呤霉素是 AA - tRNA 的结构类似物,能结合在核糖体的 A 位上,抑制 AA - tRNA 的进入。它所 带的氨基也能与生长中的肽链上的羧基反应生成肽键,反应的产物是一条 3 ’羧基端挂了一个嘌呤霉素残基的小肽。
青霉素、四环素和红霉素只与原核细胞核糖体发生作用,从而阻遏原核生物蛋白质的合成,抑 制细菌生长。
氯霉素和嘌呤霉素既能与原核细胞核糖体结合,又能与真核生物核糖体结合,妨碍细胞内蛋白 质合成,影响细胞生长。
由于细胞各部分都有特定的蛋白质组分因此合成的蛋白质必须准确无误地定向运送才能保证 生命活动的正常进行。
若某个蛋白质的合成和运转是同时发生的,则属于翻译运转同步机制;若蛋白质从核糖体上释 放后才发生运转,则属于翻译后运转机制。
这两种运转方式都涉及到蛋白质分子内特定区域与细胞膜结构的相互关系
几类主要蛋白质的运转机制
三、翻译转运 -同步机制
蛋白质定位信息存在于自身结构中,并通过与膜上特殊受体的相互作用得以表达。信号序列在 结合核糖体上合成后便与膜上特定受体相互作用,产生通道,允许这段多肽在延长的同时穿过膜结 构。因此,这种方式是边翻译边跨膜运转。
绝大部分被运入内质网内腔的蛋白质都带有一个信号肽位于蛋白质的氨基末端(13 - 36 个残 基):
(1) 一般带有 10 - 15 个疏水氨基酸;
(2)在靠近该序列 N - 端常常有 1 个或数个带正电荷的氨基酸;
(3)在其 C - 末端靠近蛋白酶切割位点处常常带有数个极性氨基酸,离切割位点最近的那个氨基 酸往往带有很短的侧链(丙氨酸或甘氨酸)。
分泌蛋白的生物合成开始于结合核糖体,翻译进行到 50 ~ 70 个氨基酸残基时,信号肽从核糖体的大亚基上露出,与粗糙内质网膜上的受体相结合。
肽过膜后被水解,新生肽随之通过蛋白孔道穿越疏水的双层磷脂。一旦核糖体移到 mRNA 的 “终止 ”密码子,蛋白质合成即告完成,翻译体系解散,膜上的蛋白孔道消失,核糖体重新处于自由状态。 SRP(信号识别蛋白)能同时识别需要通过内质网膜进行运转的新生肽和自由核糖体,并导致该 多肽合成的暂时终止
SRP - 信号肽 -多核糖体复合物即被引向内质网膜并与 SRP 的受体— DP (停靠蛋白,又称 SRP 受体蛋白)相结合。 只有当 SRP 与 DP 相结合时,多肽合成才恢复进行,信号肽部分通过膜上的核糖体受体及蛋白运 转复合物跨膜进入内质网内腔,新生肽链重新开始延伸。SRP 与 DP 的结合很可能导致受体聚集而形成膜孔道,使信号肽及与其相连的新生肽得以通过。
四、翻译后转运机制
线粒体蛋白质跨膜运转
①通过线粒体膜的蛋白质运转之前大多数以前体形式存在,由成熟蛋白质和位于 N 端的 20 ~ 80个残基的前导肽组成;
②蛋白质跨线粒体内膜运转是一种需能过程;
③蛋白质跨线粒体膜运转时,首先由外膜上的 Tom 受体复合蛋白识别与 Hsp70 或 MSF 等分子伴侣相结合的待运转多肽,通过 Tom 和 Tim 组成的膜通道进入线粒体内腔
新生蛋白质通过同步转运途径进入内质网内腔的主要过程
前导肽的作用与性质
带正电荷的碱性氨基酸(特别是精氨酸)含量较为丰富,分散于不带电荷的氨基酸序列之间;缺少 带负电荷的酸性氨基酸;羟基氨基酸含量较高;有形成两亲(既有亲水又有疏水部分)ℼ- 螺旋结构的能力。
前导肽跨膜运转时首先与线粒体外膜上的受体相结合。Tom 受体可能是线粒体蛋白质跨膜运转 时最主要的受体蛋白。有些前导肽含有“止运入 ”肽段,当该肽段被跨膜通道中的受体蛋白识别时,所运输的多肽将被定位在膜上。
叶绿体蛋白质的跨膜运转
叶绿体多肽在胞质中的游离核糖体上合成后脱离核糖体并折叠成具有三级结构的蛋白质分子, 多肽上某些特定位点结合于只有叶绿体膜上才有的特异受体位点。叶绿体定位信号肽一般有两个部分,第一部分决定该蛋白质能否进入叶绿体基质,第二部分决定该蛋白能否进入类囊体。
五、核定位蛋白的转运机制
为了核蛋白的重复定位,这些蛋白质中的信号肽—被称为核定位序列NLS 一般都不被切除。NLS 可以位于核蛋白的任何部位。
蛋白质向核内运输过程需要核运转因子 ℼ、β和一个低分子量 GTP(Ran )参与。
α和 β组成的异源二聚体是核定位蛋白的可溶性受体,与核定位序列相结合的是 “亚基。这些 蛋白组成的复合物停靠在核孔处,依靠 Ran GTP 酶水解 GTP 提供的能量进入细胞核,α和 β亚基解离,核蛋白与 α亚基解离,α和 β分别通过核孔复合体回到细胞质中,起始新一轮蛋白质运转。
六、蛋白质的降解
蛋白质降解是一个有序的过程。在大肠杆菌中,许多蛋白质的降解是通过一个依赖于 ATP 的蛋白酶(称为 Lon )来实现的。当细胞中存在有错误或半衰期很短的蛋白质时,该蛋白酶就被激活。每切除一个肽键要消耗两分子 ATP。
蛋白质的半衰期从 30 秒到许多天不等。大部分真核蛋白的半衰期为数小时至数天。成红细胞 = 110 天。真核蛋白的降解依赖于一个只有 76 个氨基酸残基、其序列高度保守的泛蛋白。 细胞内即将被降解的蛋白首先在 ATP 的作用下与泛蛋白相连,并将该复合体运送到特定的蛋白降解体系中直到完全降解。
第五章 基因的表达与调控(上)—原核基因表达调控模式
第一节 原核基因表达调控总论
自然选择倾向于保留高效率的生命过程。单细胞生物在每 30 分钟增殖一次的 10 9 细菌群体中若一个细菌变成 29 . 5 分钟增殖,经过 80 天的连续生长后,这个群体中的 99 . 9% 都将具有 29 . 5 分钟增殖一倍的生长速度。即是说:突变细胞系将在整个细胞群体中占主导地位。
原核生物细胞的基因和蛋白质种类较少,如大肠杆菌基因组约为 4 . 20 ×106bp 共有 4 288 个开放读码框。据估计,一个细胞中总共含有 107 个蛋白质分子
大肠杆菌、伤寒杆菌和尿殖道支原体基因组
每个大肠杆菌细胞有约 15 000 个核糖体,50 种核糖体蛋白、糖酵解体系的酶、DNA 聚合酶、RNA 聚合酶等都是代谢过程中必需的,其合成速率不受环境变化或代谢状态的影响,这一类蛋白质被称为永久型合成的蛋白质。
另一类则被称为适应型或调节型 , 因为这类蛋白质的合成速率明显地受环 境的影响而改变。如大肠杆菌细胞中一般只有 15 个 β- 半乳糖苷酶,但若将细胞培养在只含乳糖的 培养基中,每细胞中这个酶的量可高达几万个分子。
随着生物个体的发育,DNA 分子能有序地将其所承载的遗传信息,通过密码子-反密码子系统转变成蛋白质,执行各种生理生化功能。科学家把从 DNA 到蛋白质的过程称为基因表达 , 这个过程的调节就称为基因表达调控
基因表达调控主要表现在二方面:
细菌的转录与翻译过程几乎发生在同一时间间隔内,转录与翻译相耦联。
真核生物中,转录产物 只有从核内运转到核外,才能被核糖体翻译成蛋白质
真核与原核生物转录及翻译调控的总体特征比较
原核生物的基因调控主要是转录调控,包括负转录调控和正转录调控。在负转录调控系统中,调 节基因的产物是阻遏蛋白, 阻止结构基因转录。
负控诱导系统 正控诱导系统 负控阻遏系统 正控阻遏系统
根据其作用特征可分为负控诱导和负控阻遏二大类。
在负控诱导系统中,阻遏蛋白不与效应物(诱导物)结合时,结构基因不转录;
在负控阻遏系统中,阻遏蛋白与效应物结合时,结构基因不转录。阻遏蛋白作用于操纵区。
在正转录调控系统中,调节基因的产物是激活蛋白 。根据其作用特性分为正控诱导系统和正控阻遏系统。
在正控诱导系统中,效应物分子(诱导物)的存在使激活蛋白处于活性状态;
在正控阻遏系统中,效应物分子的存在使激活蛋白处于非活性状态
σ因子:参与大肠杆菌中基因表达调控最常见的蛋白质是 σ因子,有 6 种 σ因子,在结构上具有同源性,所以统称 70 家族,含有 4 个保守区(结构域)图 5 - 4) , 其中第 2 个和第 4 个保守区参与结合 启动区 DNA , 第 2 个保守区的另一部分还参与双链 DNA 解开成单链的过程
σ54 因子识别并与 DNA 上的 - 24 和 - 12 区相结合(图 5 - 5) 。
σ70 启动子只有在核心酶结合到 DNA 链上之后才能与启动子区结合,而 σ54 则类似于真核生物的TATA 区结合蛋白(TBP) , 可以在无核心酶时独立结合到启动子上
不同的 σ因子可以独立地起作用,但是,为了保证细胞准确地响应不同的环境信号变化,σ因子之间常常交互作用构成网络调控模式,使得原核基因的表达稳定而平衡。
σ因子本身的活性受蛋白水解酶的调控,也能被同源的抗 σ因子失活。
抗 σ因子能够与特定的 σ因子结合,阻止它们与 RNA 聚合酶组装。
σ因子的功能是帮助核心酶识别启动子,它不是 RNA 链延伸必需的
σ因子能提高 RNA 聚合酶与特异启动子的亲和力,也能降低与非特异启动子的亲和力。 =新生 RNA 链达到 6 - 9 个核苷酸,形成稳定的酶 - DNA - RNA 复合物时,σ因子释放。
σ因子通过降低核心酶与非特异序列的亲和力,和增加其与启动子的亲和力来帮助核心酶识 别启动子。
无 σ因子的核心酶也能在 DNA 模板上合成 RNA , 但不能正确地起始转录
第二节 乳糖操纵子与负控诱导系统
大肠杆菌乳糖操纵子包括 3 个结构基因:Z 、Y 和 A , 以及启动子、控制子和阻遏子 等。转录的调控是在启动区和操纵区进行的
大肠杆菌乳糖操纵子及各组分详图
3 个结构基因各决定一种酶:Z 编码-半乳糖苷酶;Y 编码-半乳糖苷透过酶;A 编码-半乳糖 苷乙酰基转移酶。
β- 半乳糖苷酶是一种 β- 半乳糖苷键的专一性酶,除能将乳糖水解成葡萄糖和半乳糖外,还 能水解其他 β- 半乳糖苷(如苯基半乳糖苷)。
β- 半乳糖苷透过酶的作用是使外界的 β- 半乳糖苷透过大肠杆菌细胞壁和原生质膜进入细 胞内。
β- 半乳糖苷乙酰基转移酶的作用是把乙酰辅酶 A 上的乙酰基转移到-半乳糖苷上,形成乙酰 半乳糖。
一、酶的诱导—lac 体系受调控的证据
一般情况下,lac + 基因型大肠杆菌细胞内 β- 半乳糖苷酶和透过酶的浓度很低,每个细胞只有 1 ~ 2 个酶分子。但是,在乳糖培养基上酶的浓度很快达到细胞总蛋白量的 6% 或 7% , 超过 105 个酶分子/ 细胞。
在无葡萄糖有乳糖的培养基中,lac + 细菌中将同时合成 β- 半乳糖苷酶和透过酶。用 32P 标记 的 mRNA 与模板 DNA 进行定量分子杂交,表明培养基中加入乳糖 1 ~ 2 分钟后,编码 β- 半乳糖苷酶 和透过酶的 lac mRNA 量就迅速增加,去掉乳糖后,lac mRNA 量立即下降。
lac 体系的“开 -关 ”特性
加入乳糖以后,1 min 内出现 lac mRNA , 稍后即产生 β- 半糖甘酶和透过酶。 当移去乳糖之后, lacmRNA 总量立即下降,两种酶活性却由于蛋白质半衰期较长而在相当长时期内维持恒定。
实验室常用两种乳糖类似物—异丙基巯基半乳糖苷(IPTG ) 和巯甲基半乳糖苷 TMG) , 在酶活性 分析中常用发色底物 O - 硝基半乳糖苷(ONPG ) 。 因为它们都不是半乳糖苷酶的底物,所以又称为安慰性诱导物
二、操纵子模型及其影响因子
Jacob 和 Monod 认为诱导酶现象是个基因调控问题,而且可以用实验方法进行研究,他们通过大量实验及分析,建立了现在已经被人们广泛接受的乳糖操纵子的控制模型
lac 操纵子的诱导模式诱导酶
Z 、Y 、A 基因产物由同一条多顺反子 mRNA 分子所编码。
该 mRNA 分子的启动区(P )位于阻遏基因(I )与操纵区(O) 之间,不能单独起始半乳糖苷酶和透过酶基因的高效表达。
操纵区是 DNA 上的一小段序列(仅为 26bp) , 是阻遏物的结合位点。
当阻遏物与操纵区相结合时,lac mRNA 的转录起始受到抑制
诱导物通过与阻遏物结合,改变其三维构象,使之不能与操纵区相结合,诱发 lac mRNA 的合成
培养基中有无诱导物对 lac mRNA 及半乳糖苷酶活性的影响阻遏物 lac I 基因产物及功能 lac 操 纵子阻遏物 mRNA 是由弱启动子控制下永久型合成的,该阻遏蛋白有 4 个相同的亚基,每个亚基均含有 347 个氨基酸残基,并能与 1 分子 IPTG 结合,每个细胞中有 5 ~ 10 个阻遏物分子
培养基中有无诱导物对 lac mRNA 及半乳糖苷酶活性的影响阻遏物 lac I 基因产物及功能 lac 操 纵子阻遏物 mRNA 是由弱启动子控制下永久型合成的,该阻遏蛋白有 4 个相同的亚基,每个亚基均含有 347 个氨基酸残基,并能与 1 分子 IPTG 结合,每个细胞中有 5 ~ 10 个阻遏物分子。
如果将葡萄糖和乳糖同时加入培养基中,大肠杆菌在耗尽外源葡萄糖之前不会诱发 lac 操纵子。 不是葡萄糖而是它的某些降解产物抑制 lac mRNA 的合成,科学上把葡萄糖的这种效应称之为代谢物阻遏效应 。
cAMP 与代谢物激活蛋白 cAMP 是在腺苷酸环化酶的作用下由 ATP转变而来的,在真核生物的激素调节过程中也起着十分重要的作用。
将细菌放在含葡萄糖的培养基中培养,cAMP 的浓度就低;如果培养基中只有甘油或乳糖等不进行糖酵解途径的碳源,cAMP 的浓度就会很高
大肠杆菌中的代谢物激活蛋白,由 Crp 基因编码,能与 cAMP 形成复合物。CRP 和 cAMP 都是合 成 lac mRNA 所必需的,cAMP - CRP 是一个不同于阻遏物的正调控因子,而 lac 操纵子的功能是在这 两个相互独立的调控体系作用下实现的。
半乳糖、麦芽糖、阿拉伯糖、山梨醇等在降解过程中均转化成葡萄糖或糖酵解途径中的其他中间产物,这些糖代谢中有关的酶都是由可诱导操纵子控制的,被称为降解物敏感型操纵子 , 由 cAMP - CRP 调控。
cAMP - CRP 复合物与启动子区的结合是 lac mRNA 合成起始所必需的,因为这个复合物结合于 启动子上游,能使 DNA 双螺旋发生弯曲,有利于形成稳定的开放型启动子 - RNA 聚合酶结构。阻遏 物则是一个抗解链蛋白,阻止形成开放结构,而抑制 RNA 聚合酶的功能
三、lac 操纵子的调控区域—P、O 区
P 区(即启动子区)一般是从Ⅰ基因结束到 mRNA 转录起始位点下游 5 - 10bp , 而 O 区(即阻遏 物结合区)位于 - 7 + ~ 28 位,该区的碱基序列有对称性,其对称轴在 + 11 位碱基对
四、lac 操纵子中的其他问题
lac 基因产物数量上的比较
在完全被诱导的细胞中,β- 半乳糖苷酶、透过酶及乙酰基转移酶的拷贝数比例为 1 :0 . 5:0 . 2 , 这 个比例在一定程度上反映了以 β- 半乳糖苷作为唯一碳源时细胞的需要。不同的酶在数量上的差异是由于在翻译水平上受到调节所致。
①lac mRNA 可能与翻译过程中的核糖体相脱离,从而终止蛋白质链的翻译。 因此,存在着从 mRNA 的 5 ′末端到 3 ′末端的蛋白质合成梯度。
②在 lac mRNA 分子内部,A 基因比 Z 基因更易受内切酶作用发生降解,因此,在任何时候 Z 基因 的完整拷贝数要比 A 基因多
操纵子的融合与基因工程
pur 操纵子在染色体上位于 lac 操纵子沿转录方向的下游,中间只隔了一个控制细胞对 T6 噬菌体 敏感性的 tsx 基因。pur 操纵子被“嫁接 ”到 lac 启动子上,形成融合基因。因为 lac 启动子是一个很强 的启动子,通过它可以使较弱启动子的转录增强
第三节 色氨酸操纵子与负控阻遏系统
色氨酸的合成主要分 5 步完成,有 7 个基因参与整个合成过程
rp 体系参与生物合成,它不受葡萄糖或 cAMP - CRP 的调控
trpE 和 trpG 编码邻氨基苯甲酸合酶,trpD 编码邻氨基苯甲酸磷酸核糖转移酶,trpF 编码异构酶,trpC 编码吲哚甘油磷酸合酶,trpA 和 trpB 则分别编码色氨酸合酶的 “和 β亚基。
在许多细菌中,trpE 和 trpG , trpC 和 trpB 分别融合成一个基因,产生具有双重功能的蛋白质。
trpE 基因是第一个被翻译的基因,与 trpE 紧邻的是启动子区和操纵区。
前导区和弱化子区分别定名为 trpL 和 trpa 。
trp 操纵子中产生阻遏物的基因是 trpR , 该基因距 trp 基因簇很远。后者位于大肠杆菌染色体图 上 25 分钟处,而前者则位于 90 分钟处。在位于 65 分钟处还有一个 trpS(色氨酸 tRNA 合成酶),它与携带有色氨酸的 tRNATrp 共同参与 trp 操纵子的调控作用
一、trp 操纵子的阻遏系统
肠杆菌中 Try 操纵子
trpR 基因突变常引起 trp mRNA 的永久型合成,该基因产物因此被称为辅阻遏蛋白( aporepressor ) 。除非培养基中有色氨酸,否则这个辅阻遏蛋白不会与操纵区结合。辅阻遏蛋白与色氨酸相结合形成有活性的阻遏物,与操纵区结合并关闭 trp mRNA 转录
效应物分子色氨酸是trp 操纵子所编码的生物合成途径的末端终产物。
当培养基中色氨酸含量较高时,它与游离的辅阻遏蛋白相结合,并使之与操纵区 DNA 紧密结合;
当培养基中色氨酸供应不足时,辅阻遏物失去色氨酸并从操纵区上解离,trp 操纵子去阻遏
二、弱化子与前导肽
弱化子
前导肽
前导序列包括起始密码子 AUG 和终止密码子 UGA , 能产生一个含有 14 个氨基酸的多肽,这个假设的多肽被称为前导肽
在前导序列的第 10 和第 11 位上有相邻的两个色氨酸密码子。组氨酸操纵子含有 7 个相邻的组 氨酸密码子,苯丙氨酸操纵子也有 7 个苯丙氨酸密码子,这些密码子参与了操纵子中的转录弱化机制。
mRNA 前导区序列
trp 前导区的碱基序列已经全部测定,引人注目的是其中 4 个分别以 1 、2 、3 和 4 表示的片段能 以两种不同的方式进行碱基配对,有时以 1 - 2 和 3 - 4 配对,有时只以 2 - 3 方式互补配对。
配对区正好位于终止密码子的识别区,当这个区域发生破坏,碱基发生突变时有利于转录的 继续进行
三、trp 操纵子弱化机制
培养基中色氨酸浓度低,负载有色氨酸的 tRNATrp 就少,翻译通过两个相邻色氨酸密码子的速度 就慢,当 4 区被转录完成时,核糖体才进行到 1 区(或停留在两个相邻的 trp 密码子处),前导区 2 - 3 配对,不形成 3 - 4 配对的终止结构,转录继续进行。
培养基中色氨酸浓度高,核糖体顺利通过两个相邻的色氨酸密码子,在 4 区被转录之前就到达 2 区,3 - 4 区自由配对形成茎-环状终止子结构,转录停止。所以,弱化子对 RNA 聚合酶的影响依赖于 前导肽翻译中核糖体所处的位置。
一般认为,阻遏物从有活性向无活性的转变速度较慢,需要有一个能更快地做出反应的系统,以 保持培养基中适当的色氨酸水平。弱化子能较快地通过抗终止的方法来增加 trp 基因表达,迅速提高内源色氨酸浓度
第四节 其他操纵子
一、半乳糖操纵子
大肠杆菌半乳糖操纵子包括 3 个结构基因:异构酶, 半乳糖-磷酸尿嘧啶核苷转移酶(galT ) , 半乳糖激酶(g galK) , 使半乳糖变成葡萄糖 - 1 - 磷酸。
半乳糖操纵子的调节基因是 galR 。与 lac 操纵子所不同的是,galR 与 galE 、T 、K 及操纵区 O 等 的距离都很远,而 galR 产物对 galO 的作用与 lacI - lacO 的作用相同。gal 操纵子的诱导物主要是半乳 糖。
gal 操纵子有两个特点:
①个启动子,其 mRNA 可从两个不同的起始点开始转录;
②两个 O 区,一个在 P 区上游 - 67 ~ - 73 , 另一个在结构基因 galE 内部。
二、阿拉伯糖操纵子
araB 、araA 和 araD 基因参与阿拉伯糖的降解,它们是一个基因簇,简写为 araBAD 。
分别编码核酮糖激酶、L - 阿拉伯糖异构酶、L - 核酮糖 - 5 - 磷酸 - 4 - 差向异构酶。
araE 和araF 负责将阿拉伯糖运入细胞内,它们位于远离这个基因簇的地方,分别编码一个膜蛋白和一个位于细胞壁与细胞膜之间的阿拉伯糖结合蛋白。
araBAD 具有复合启动子区域,两个操纵区(O1 , O2 )和一个调节基因 araC 。在 lac 和 gal 操纵子 中,阻遏蛋白只能作为负调节因子,而 cAMP - CRP 蛋白只能是正调节因子。AraC 蛋白同时显示正、负调节因子的功能。
araBAD 和 araC 基因的转录是分别在两条链上以相反的方向进行的,araBAD 基因簇从启动子PBAD 开始向右进行转录,而 araC 基因则是从 Pc 向左转录。
Ara 操纵子上游调控区序列与功能分析
ara 操纵子也是可诱导的,阿拉伯糖本身就是诱导物。在野生型操纵子中,只有阿拉伯糖存在时 才转录出 araBADmRNA , 而有葡萄糖存在时则不转录。腺苷酸环化酶缺陷型和 crp - 突变株也不形成 araBAD mRNA , 说明从 PBAD 起始的转录过程也需要 cAMP - CRP。
a. 没有 AraC 蛋白时,由 Pc 启动子起始 araC 基因转录;
b . 葡萄糖水平较高时,AraC 蛋白与操纵区 O2 以及 ara I 上半区相结合,形成 DNA 回转结构,ar- aBAD 基因不表达;
c . 有阿拉伯糖但无葡萄糖存在时,AraC 与阿拉伯糖相结合,变构成为激活蛋白,与 araO1 和 araI 区相结合,在 CRP - cAMP 的共同作用下起始结构基因表达。
有葡萄糖,无阿拉伯糖
cAMP - CRP 没有与操纵区位点相结合,AraC 蛋白处于 Pr 形式并与操纵区 A 位点结合,RNA 聚合酶不能与 Pc 结合,araC 基因受到抑制,整个系统几乎处于静止状态。
无葡萄糖,无阿拉伯糖
因为没有诱导物,尽管有 cAMP - CRP 与操纵区位点相结合,AraC 蛋白仍以 Pr 形式为主,无法 与操纵区 B 位点相结合,无 araBAD mRNA 转录。
无葡萄糖,有阿拉伯糖
大量 araC 基因产物以 Pi 形式存在,并分别与操纵区 B 、A 位点相结合,在 cAMP - CRP 的共同作用下,araC 和 araBAD 基因大量表达,操纵子充分激活。
第五节 多启动子调控的操纵子
一、细胞中的 SOS 反应
当细菌 DNA 遭到破坏时,细胞内会启动一个被称为 SOS 的诱导型 DNA 修复系统。
参与 SOS DNA 修复系统的基因都受 LexA 阻遏蛋白的抑制,SOS 体系的诱导表达过程中 LexA 阻遏蛋白被移开。
肠杆菌受 LexA 蛋白阻遏的 SOS DNA 损伤修复系统操纵子表达调控模式
大肠杆菌基因组 DNA
一般情况下,约有 1000 个 RecA 蛋白单体分散在每个细胞中。当 DNA 严重受损时,单链 DNA 缺 口数量增加,RecA 与这些缺口处单链 DNA 相结合,被激活成为蛋白酶,将 LexA 蛋白切割成没有阻遏和操纵区 DNA 结合活性的两个片段,导致 SOS 体系(包括 recA 基因)高效表达,DNA 得到修复
二、二组分调控系统和信号转动
最简单的细胞信号系统称为二组分系统 , 由二种不同的蛋白质组成:即位于细胞质膜上的传感蛋白(及位于细胞质中的应答调节蛋白
细菌中参与信号转导的二组分调控系统
传感激酶常在与膜外环境的信号反应过程中被磷酸化,再将其磷酰基团转移到应答调节蛋白上,磷酸化的应答调节蛋白即成为阻遏或诱导蛋白,通过对操纵子的阻遏或激活作用调控下游基因表达。
三、多启动子调控的操纵子
rRNA 操纵子
大肠杆菌 rRNA 操纵子( rrnE)上有两个启动子 P1 和 P 2 。在对数生长期,P1 起始的转录产物比 P2 起始的产物多 3 ~ 5 倍。当细菌处于紧急状态,细胞中 ppGpp 浓度增加,P1 的作用被抑制。 因为 rRNA 是细胞中蛋白质合成机器核糖体的重要组成部分,不能完全停止供应,由 P2 起始 rrnE 基因转录。
核糖体蛋白 SI 操纵子
核糖体蛋白 SI 操纵子( rpsA)也受应急反应调节。rpsA 有 4 个启动子,P1 、P 2 是强启动子,平时 主要依靠它们来启动基因的表达,合成 SI 蛋白。P3 、P 4 是弱启动子,只有在紧急情况下,P1 、P 2 启动子受 ppGpp 的抑制,由 P3 、P 4 起始合成的 SI 蛋白维持生命的最低需要。
D naQ 蛋白操纵子
DnaQ 蛋白是 DNA 聚合酶全酶的亚基。在细胞中 RNA 聚合酶活性较低时,操纵子的转录由弱启动子 P2 控制;而 RNA 聚合酶活性较时,就开始利用强启动子 P1 。也就是说,在细胞生命活动比较缓 慢时,DnaQ 蛋白的合靠弱启动子 P2 来维持。当细胞增殖速度加快,RNA 聚合酶活性升高时,P1 就被激活
第六节 转录水平上的其他调控方式
一、σ因子的调节作用
σ32 因子与热激蛋白的表达
大肠杆菌的最适生长温度是 37℃ 。当温度上升至 46℃时,大肠杆菌几乎停止生长。在 46℃下细 胞合成的蛋白质大约 30% 为一组相当保守的热激蛋白HSP)。很多热激蛋白是分子伴侣和蛋白酶。分子伴侣的作用是介导蛋白质正确折叠;蛋白酶的作用则是降解受到热损伤而又不能修复的蛋白质。
二、组蛋白类似蛋白的调节作用
细菌中存在一些组蛋白类似蛋白,能非特异地结合 DNA , 维持其高级结构( 例如 H - NS) 。H - NS 与大肠杆菌基因组上分散的大量基因的调控区有较高的亲和性,这些基因与环境条件的变化有关,H - NS 的结合能抑制这些基因的转录
三、转录调控因子的作用
大肠杆菌中大约有 300 多个基因编码与启动子区结合的蛋白,它们能激活或抑制转录,称为转录调控因子。它们大多是序列特异性的 DNA 结合蛋白,能与特定的启动子结合。
有些转录调控因子能调控很多基因的表达(如 CRP , FNR , IHF , Fis … ) , 有些只能调节一两个启 动子。许多基因的启动子区有多个转录调控因子的结合位点,共同作用才能使 RNA 聚合酶顺利起始基因转录。
四、抗终止因子的调节作用
抗终止蛋白阻止转录的终止作用,因此 RNA 聚合酶能够越过终止子继续转录 DNA 。 抗终止因子在 RNAP 到达终止子之前与之结合。主要见于噬菌体和少数细菌。
λ噬菌体裂解周期中的级联调控依赖于抗终止作用
噬菌体是以 E . coli 为宿主的温和病毒。它一旦感染细菌就会以 2 种方式繁殖。
①溶源途径:噬菌体感染 E . coli 后,将其基因组整合到细菌染色体上,随着细菌染色体的复制而 复制。这一过程称为溶源途径。
②溶菌途径:噬菌体感染宿主后也可以利用细菌细胞内的养料进行繁殖,最终使宿主裂解而死 亡,这一过程称为溶菌途径。
溶源性细菌在正常情况下非常稳定;但在细菌受某些外界物理或化学因素( 如紫外线、丝裂霉素 C 等)的作用,就会有效的转向溶菌途径。原噬菌体便脱离细菌染色体而进行自主复制,于是细菌裂解,游离出大量的噬菌体,这一过程称为溶源性诱导。
对繁殖途径的选择依赖于细胞对 2 种选择性基因表达程序的选择。
第七节 转录后调控
一、mRNA 自身结构元件对翻译起始的调控
大肠杆菌有 14% 的基因起始密码子是 GUG、3% 为 UUG , 另有两个是 AUU , 这些密码子与 fMet - tRNA 的配对能力弱,从而导致翻译效率下降。
mRNA 的二级结构也是翻译起始调控的重要因素。 因为核糖体的 30S 亚基必须与 mRNA 结合, 要求 mRNA5 ’端有一定的空间结构。SD 序列的微小变化,往往会导致表达效率成百上千倍的差异, 这是由于核苷酸的变化改变了形成mRNA 5 ’端二级结构的自由能,影响了 30S 亚基与 mRNA 的结合,从而造成了蛋白质合成效率上的差异。
二、mRNA 稳定性对转录水平的影响
所有细胞都有一系列核酸酶,用来清除无用的 mRNA 。一个典型的 mRNA 半衰期为 2 - 3 min 。 mRNA 分子被降解的可能性取决于其二级结构
三、调节蛋白的调控作用
细菌中有些 mRNA 结合蛋白可激活靶基因的翻译。相反,mRNA 特异性抑制蛋白则通过与核糖体竞争性结合 mRNA 分子来抑制翻译的起始。大肠杆菌中的核糖体蛋白就存在翻译抑制现象
四、反义 RNA 的调节作用
RNA 调节是原核基因表达转录后调节的另一种重要机制。细菌响应环境压力的改变,会产生一 些非编码小 RNA 分子,能与 mRNA 中的特定序列配对并改变其构象,导致翻译过程的开启或关闭等作用。
反义 RNA是与 mRNA 互补的 RNA 分子。
反义 RNA 能与 mRNA 分子特异性地互补结合,从而抑制该 mRNA 的加工与翻译。可调控原核细胞中基因表达、控制噬菌体溶菌-溶源状态以及抑制转座子的转位作用等。
通过人工合成反义 RNA 的基因,并将其导入细胞内转录出反义 RNA , 即能抑制特定基因的表达, 阻断该基因的功能,有助于了解该基因对细胞生长和分化的作用。 同时也有对肿瘤实施基因治疗的可能性
五、稀有密码子对翻译的影响
许多调控蛋白在细胞内含量很低,编码这些蛋白的基因中高频率地使用了很多稀有密码子,稀有密码子对应次要(低丰度)的 tRNA 。因此,翻译速度受 tRNA 供应的限制,影响了蛋白质合成的总量。
其它基因中利用这些稀有密码子频率很低。
第六章 基因的表达与调控(下)— 真核基因表达调控
真核细胞与原核细胞在基因结构、转录、翻译方面存在的差异:
①在真核细胞中,一条成熟的 mRNA 链只能翻译出一条多肽链,原核生物中很少见到多基因操纵子形式。
②真核细胞 DNA 与组蛋白和大量非组蛋白结合,只有一小部分 DNA 是裸露的。
③高等真核细胞 DNA 中很大一部分是不转录的。大部分真核细胞的基因中间存在内含子。
④真核生物能够有序地根据生长发育阶段的需要进行 DNA 片段重排,增加细胞内某些基因的拷贝。
⑤基因转录的调节区很大,可能远离转录起始位点达几百个甚至上千个碱基对,主要通过改变整个所控制基因 5 ′上游区 DNA 构型来影响它与 RNA 聚合酶的结合能力。
⑥真核生物的 RNA 在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质。
⑦许多真核生物的基因只有经过复杂的成熟和剪接过程,才能被顺利地翻译成蛋白质。
第一节 真核生物的基因结构与转录活性
一、基因家族
简单多基因家族
简单多基因家族中的基因一般以串联方式前后相连。
在真核生物中,前 rRNA 转录产物的分子量为 45S ,(约有 14 000 个核苷酸),包括 18S , 28S 和 5 . 8S 三个主要 rRNA 分子。
复杂多基因家族
复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。
海胆组蛋白基因家族:编码不同组蛋白的基因处于一个约为 6 000bp 的片段中,分别被间隔序列所隔开。这 5 个基因组成的串联单位在整个海胆基因组中可能重复多达 1 000 次。
发育调控的复杂多基因家族
血红蛋白是所有动物体内输送分子氧的主要载体,由 2α2β组成的四聚体加上一个血红素辅基后 形成功能性血红蛋白。在生物个体发育的不同阶段出现几种不同形式的 α和 β亚基。
人 α珠蛋白基因簇位于 16 号染色体短臂上,约占 30kb 左右,其中 δ为胚胎期基因。β珠蛋白基 因簇位于 11 号染色体短臂上,约占 50 - 60kb , 其中 ε为胚胎期基因,Gγ和 Aγ为胎儿型基因,δ和 β为成人期基因。
二、真核基因的断裂结构
外显子与内含子
大多数真核基因都是由蛋白质编码序列和非蛋白质编码序列两部分组成的。
“intron ”是指存在于原始转录物或基因组 DNA 中,但不存在于成熟 mRNA、rRNA 或 tRNA 中的那部分核苷酸序列。
基因中的内含子数量和大小都不同。胶原蛋白基因长约 40kb , 至少有 40 个内含子,其中短的只有 50bp , 长的可达到 2000bp 。
不同真核生物基因的平均长度及单个基因平均含有外显子数量比较
外显子与内含子的连接区
断裂结构的一个重要特点是外显子 -内含子连接区的高度保守性和特异 性碱基序列。其重要特征是内含子的两端序列之间没有广泛的同源性,因此内含子两端序列不能互补,在剪接加工之前,内含子上游序列和下游序列不可能通过碱基配对形成发卡式二级结构。
序列分析表明,几乎每个内含子 5 ′端起始的两个碱基都是 GT , 而 3 ′端最后两个碱基总是 AG , 由 于这两个碱基的高度保守性和广泛性,有人把它称为 GT - AG 法则,即:5 ′GT … …AG 3 ′。
外显子与内含子的可变调控
在基因转录,加工产生成熟 mRNA 分子时,内含子通过剪接加工被去掉,保留在成熟的 mRNA 分子中的外显子被拼接在一起,最终被翻译成蛋白质。
有些真核基因,如肌红蛋白重链基因虽有 41 个外显子,却能精确地剪接成一个成熟的 mRNA , 我们称这种方式为组成型剪接。一个基因的转录产物通过组成型剪接只能产生一种成熟的 mRNA , 编码一个多肽。
有些基因选择了不同的启动子,或者选择了不同的多聚( A) 位点而使原始转录物具有不同的二 级结构,产生不同的 mRNA 分子。同一基因的转录产物由于不同的剪接方式形成不同 mRNA 的过程 称为选择性剪接。
小鼠淀粉酶基因表达的组织特异性变化就是一个例子
不同外显子的使用导致淀粉酶基因在不同组织中表达水平的差异:在肝脏中,mRNA 5 ′端的 161个碱基是由位于第 2 号外显子转录起始点上游 4 500bp 处的 L 外显子编码的。
在唾液腺中,m RNA 5 ′端的 50 个碱基是由位于转录起始点上游 7 300bp 处的 S 外显子编码的 。
L 外显子和 S 外显子分别为淀粉酶 mRNA 提供了不同的起始序列。其实,L 外显子只是唾液腺淀粉酶基因中内含子序列的一部分,将在 mRNA 成熟过程中被切除。
一个基因的内含子成为另一个基因的外显子,形成基因的差别表达,这是真核基因的一个重要 特点。
三、真核生物 DNA 水平上的基因表达调控
基因扩增
基因扩增是指某些基因的拷贝数专一性大量增加的现象,它使细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。
非洲爪蟾的卵母细胞中原有 rRNA 基因( rDNA)约 500 个拷贝,在减数分裂粗线期,基因开始迅速 复制,到双线期拷贝数约为 200 万个,扩增近 4000 倍,可用于合成 10 12 个核糖体。
基因重排与变换
将一个基因从远离启动子的地方移到较近的位点从而启动转录,被称为基因重排。
免疫球蛋白的肽链主要由可变区(V 区)、恒定区(C 区)以及两者之间的连接区(J 区)组成,V 、C 和 J 基因片段在胚胎细胞中相隔较远。编码产生免疫球蛋白的细胞发育分化时,通过染色体内 DNA重组把 4 个相隔较远的基因片段连接在一起,产生具有表达活性的免疫球蛋白基因
免疫球蛋白重链基因片段重排与组织特异性表达
四、DNA 甲基化与基因调控
DNA 甲基化能引起染色质结构、DNA 构象、DNA 稳定性及 DNA 与蛋白质相互作用方式的改变, 从而控制基因表达。研究证实,CpG 二核苷酸中胞嘧啶的甲基化导致了人体 1 /3 以上由于碱基转换而引起的遗传病。
DNA 的甲基化
DNA 甲基化主要形成 5 - 甲基胞嘧啶和少量的 N6 - 甲基腺嘌呤及 7 - 甲基鸟嘌呤。
真核生物中,5 - 甲基胞嘧啶主要出现在 CpG、CpXpG、CCA/TGG 和 GATC 中。
高等生物 CpG 二核苷酸中的 C 通常被甲基化,极易自发脱氨,生成胸腺嘧啶,所以 CpG 二核苷酸序列出现的频率远远低于按核苷酸组成计算出的频率
DNA 甲基化抑制基因转录的机制
DNA 甲基化导致某些区域 DNA 构象变化,从而影响了蛋白质与 DNA 的相互作用,抑制了转录因 子与启动区 DNA 的结合效率。
5 - 甲基胞嘧啶在 DNA 分子上并不是随即分布的,基因的 5 ’端和 3 ’端往往富含甲基化位点,而启动区 DNA 分子上的甲基化密度与基因转录受抑制的程度密切相关。
对于弱启动子来说,稀少的甲基化就能使其完全失去转录活性。当这一类启动子被增强时(带有 增强子),即使不去甲基化也可以恢复其转录活性。若进一步提高甲基化密度,即使增强后的启动子 仍无转录活性。
第二节 真核基因转录机器的主要组成
一、真核基因的转录
真核基因调控主要在转录水平上进行,受大量特定的顺式作用元件和反式作用因子( 又称跨域作用因子)调控。
真核生物的转录调控大多数是通过顺式作用元件和反式作用因子复杂的互相作用来实现的。
一个完整的基因,不但包括编码区 , 还包括 5 ’和 3 ’端长度不等的特异性序列,它 们虽然不编码氨基酸,却在基因表达的过程中起着重要作用。所以,“基因 ”的分子生物学定义是:产 生一条多肽链或功能 RNA 所必需的全部核苷酸序列
启动子
真核基因启动子由核心启动子和上游启动子两个部分组成,是在基因转录起始位点( + 1) 及其 5 ’上游大约 100 ~ 200bp 以内的一组具有独立功能的 DNA 序列,每个元件长度约为 7 ~ 20bp , 是决定RNA 聚合酶 II 转录起始点和转录频率的关键元件。
核心启动子
是指保证 RNA 聚合酶Ⅱ转录正常起始所必需的 、最少的 DNA 序列,包括转录起始位点及转 录起始位点上游 - 25 ~ - 30bp 处的 TATA 盒 。核心启动子确定转录起始位点并产生基础水平 的转录 。
上游 启 动 子 元 件 ( UPE )
包 括 通 常 位 于 - 70 bp 附 近 的 CAAT 盒( CCAAT) 和 GC 盒 ( GGGCGG) 等,能 通 过 TFIID 复 合 物 调 节 转 录 起 始 的 频 率,提 高 转 录效率 。
二、增强子及其对转录的影响
增强子是指能使与它连锁的基因转录频率明显增加的 DNA 序列,最早发现于 SV40 早期基因的上游,有两个长 72bp 的正向重复序列。
病毒、植物、动物和人类正常细胞中都发现有增强子存在。
增强子通常具有下列特性:
三、反式作用因子
真核生物启动子和增强子是由若干 DNA 序列元件组成的,由于它们常与特定的功能基因连锁在 一起,因此被称为顺式作用元件。这些序列组成基因转录的调控区,影响基因的表达。在转录调控过 程中,除了需要调控区外,还需要反式作用因子
真核生物中转录因子活性调节的主要方式
根据各个蛋白质成分在转录中的作用,能将整个复合物分为 3 部分:
①与所有或某些转录阶段的 RNA 聚合酶亚基,不具有基因特异性。
②转录的起始或终止有关的辅助因子,不具有基因特异性。
③与特异调控序列结合的转录因子。
DNA 识别或结合域
反式作用因子是能直接或间接地识别或结合在各类顺式作用元件核心序列上(表 7 - 5) , 参与调 控靶基因转录效率的蛋白质。
部分球蛋白基因 5 ’调控区序列的保守性比较
螺旋-转折-螺旋结构。
这一类蛋白质分子中有至少两个 “螺旋,中间由短侧连氨基酸残基形成 “转折 ”,近羧基端的 “螺旋中氨基酸残基的替换会影响该蛋白质在 DNA 双螺旋大沟中的结合。
与 DNA 相互作用时,同源域蛋白的第一、二两个螺旋往往靠在外侧,其第三个螺旋则与 DNA 大 沟结合,并通过其 N 端的多余臂与 DNA 的小沟结合
同源域蛋白通过其第三个螺旋与双链 DNA 的大沟相结合,其 N 端的多余臂部分则与 DNA 的小沟相结合,提高了稳定性
锌指蛋白
典型的类固醇激素受体结构示意图
包括锌指、锌钮( twist) 和锌簇( cluster) 结构,有锌参与时才具备转录调控活性。与 DNA 的结合较为牢固,特异性也很高。
类固醇激素受体家族含有连续的两个锌指结构,以同源或异源性二聚体的方式将两个 “螺旋结合在相邻的两个大沟中
碱性-亮氨酸拉链
即 bZIP 结构。蛋白中每隔 6 个氨基酸就有一个亮氨酸残基,导致第 7 个亮氨酸残基都在螺旋的 同一方向出现。
以二聚体形式与 NA 结合,亮氨酸拉链区并不直接结合 DNA , 肽链氨基端 20 ~ 30 个富含碱性氨 基酸结构域与 DNA 结合,但以碱性区和亮氨酸拉链结构域整体作为基础
碱性亮氨酸拉链转录激活蛋白与调控区 DNA 相结合的示意图
碱性-螺旋-环-螺旋( 即 bHLH 结构)
同源域
转录活化结构域
在真核生物中,反式作用因子的功能由于受蛋白质 -蛋白质之间相互作用的调节变得精密、复杂,完整的转录调控功能通常以复合物的方式来完成,因此,是否具有转录活化域就成为反式作用因子中唯一 的结构基础。
不同的转录活化域有下列特征性结构:
带负电荷的螺旋结构
哺乳动物细胞中糖皮质激素受体的两个转录活化域,AP1 家族的 Jun 及 GAL4 都有酸性的螺 旋结构,它们可能与 TFIID 复合物中某个通用因子或 RNA 聚合酶 Ⅱ本身结合,具有稳定转录起 始复合物的作用 。
富含谷氨酰胺的结构
SP1 是启动子 GC 盒的结合蛋白,共有 4 个参与转录活化的区域,其中最强的转录活化域含 25% 左右的谷氨酰胺。哺乳动物细胞中的 Oct1 /2 、Jun 、AP2 、血清应答因子( SRF) 等都有相同的富含谷氨酰胺的结构域。
富含脯氨酸的结构
CTF - NF1 因子的羧基端富含脯氨酸(达 20% ~ 30% ) , 很难形成 α螺旋。在 Oct2 、Jun 、AP2 、 SRF 等哺乳动物因子中也有富含脯氨酸的结构域。
第三节 蛋白质磷酸化对基因转录的调控
细胞通过 DNA 的复制和细胞分裂将本身所固有的遗传信息由亲代传至子代,实现增殖繁衍。它们还不断地“感知 ”环境变化,并对其作出特定的应答。
细胞应答可以分为 3 个阶段:
①界信息的“感知 ”,即由细胞膜到细胞核内的信息传递;
②色质水平上的基因活性调控;
③定基因的表达,即从 NA→RNA→蛋白质的遗传信息传递过程。
蛋白质的磷酸化与去磷酸化过程是生物体内普遍存在的信息传导调节方式,几乎涉及 所有的生理及病理过程,如糖代谢、光合作用、细胞的生长发育、神经递质的合成与释放甚至癌变等。
细胞表面受体与配体分子的高亲和力特异性结合,能诱导受体蛋白构象变化,使胞外信号顺利通 过质膜进入细胞内 , 或使受体发生寡聚化而被激活,刺激该受体蛋白的激酶活性,引发生理反应。
受体分子活化细胞功能的途径主要有两条:
一是受体本身或受体结合蛋白具有内源酪氨酸激酶活性,胞内信号通过酪氨酸激酶途径得到 传递;
二是配体与细胞表面受体结合,通过 G 蛋白介异的效应系统产生介质,活化丝氨酸/ 苏氨酸或酪 氨酸激酶,从而传递信号。
受配体结合调控的离子通道也可作为膜上的受体之一参与信息传导。信息转导是维系外部刺激与细胞反应的桥梁。近年来,数条跨膜信号转到途径已经被逐步阐明。
在这些已知的上游途径中,又以酪氨酸蛋白激酶( PTK) 途径及受体偶联的 G 蛋白途径较为引人 注目。
细胞表面的三类受体示意图
A . 受配体结合调控的离子通道
B . 与 G 蛋白相藕连的受体系统
C . 跨膜蛋白激酶-受体系统
真核细胞主要跨膜信号传导途径
蛋白质磷酸化和 GTP 结合蛋白参与的信号转导过程
已发现蛋白激酶(PK)基因 2000 余个和 1000 个左右蛋白质去磷酸化酶基因。根据底物蛋白质被磷酸化的氨基酸残基可分为:
①丝氨酸/苏氨酸型;
②氨酸型;
③氨酸型。
根据是否有蛋白激酶活性参与可将调节方式分为两大类:信使依赖型( 又分胞内信使、调节因子依赖型和激素或生长因子依赖型)和非信使依赖型
一、受 cAMP 水平调控的 A 激酶
依赖于 cAMP 的蛋白激酶称为 A 激酶(PKA ) , 它能把 ATP 分子上的末端磷酸基团加到某个特定蛋白质的丝氨酸或苏氨酸残基上。
被 A 激酶磷酸化的氨基酸 N 端上游往往存在两个或两个以上碱性氨基酸,特定氨基酸的磷酸化 (X - Arg - Arg - X - Ser - X)改变了这一蛋白的酶活性。
在不同的细胞中,A 激酶的反应底物不一样,所以,cAMP 能在不同靶细胞中诱发不同的反应。
非活性状态的 PKA 全酶由 4 个亚基 R2C2 所组成,分子量约为 150 - 170 , 调节亚基与 cAMP 相结 合,引起构象变化并释放催化亚基,后者随即成为有催化活性的单体
图 6 - 31 cAMP 调控的 A 激酶活性
糖原代谢时,激素与其受体在肌肉细胞外表面相结合,诱发细胞质 cAMP 的合成并活化 A 激酶,后者再将活化磷酸基团传递给无活性的磷酸化酶激酶,活化糖原磷酸化酶,最终将糖原磷酸化,进入 糖酵解过程并提供 ATP
二、C 激酶与 PIP2 、IP3 和 DAG
C 激酶(PKC)是信号传递蛋白,该蛋白激酶活性是依赖于 Ca2 + 。
IP3 引起细胞质 Ca2 + 浓度升高,导致 C 激酶从胞质转运到靠近原生质膜内侧处,并被 DAG 和C a2 + 的双重影响所激活。DAG 提高了 C 激酶对于 Ca2 + 的亲和力。
C 激酶是一个 7 . 7 ×104 的蛋白质,主要实施对丝氨酸、苏氨酸的磷酸化,它具有一个催化结构域 和一个调节结构域。
三、C aM 激酶及 MAP 激酶
C a2 + 的细胞学功能主要通过钙调蛋白激酶(CaM - kinase )来实现的,它们也是一类丝氨酸/ 苏氨酸激酶,但仅应答于细胞内 Ca2 + 水平。
MAP - 激酶(ERKS )活性受许多外源细胞生长、分化因子的诱导。MAP - 激酶的活性取决于该蛋白中仅有一个氨基酸之隔的酪氨酸、丝氨酸残基是否都被磷酸化。
能同时催化这两个氨基酸(丝氨酸/ 苏氨酸)残基磷酸化的酶被称为 MAP - 激酶 -激酶,它的反 应底物是 MAP 激酶。MAP - 激酶-激酶本身能被 MAP - 激酶-激酶-激酶所磷酸化激活,后者能同时被 C 激酶或酪氨酸激酶家族的 Ras 蛋白等激活,从而在信息传导中发挥功能。
四、酪氨酸蛋白激酶(PTK)途径
PTK 包括跨膜受体家族与胞质非受体家族两大类。受体类由胞外结合配体结构域、跨膜结构域 和细胞质激酶结构域组成,其 PTK 活性受胞外结构域与配体的调节。配体与受体结合可诱导受体蛋白的二聚化,将受体胞质区酪氨酸残基磷酸化。
非受体酪氨酸激酶除有一段与前者同源的激酶结构域序列外,还有数个前者所不同的保守区。
因为 Src 亚家族非受体酪氨酸激酶以及许多 PTK 作用底物分子都存在被称为 Src 同源结构域 (SH)的序列,所以又将激酶功能区成为 SH1 , 而将另外两个区分别命名为 SH2 和SH3 。
五、蛋白质磷酸化与细胞分裂调控
细胞通过 P53 及 P21 蛋白控制 CDK活性,调控细胞分裂的进程
CDK 的活性也受细胞周期蛋白和磷酸化调控。
细胞中没有周期蛋白,CDK 无活性。
随着周期蛋白的合成和积累,逐步形成周期蛋白 - CDK 复合物。
CDK 上的酪氨酸位点被磷酸化,掩盖了其 ATP 结合位点,ATP 不能有效地与之相结合,CDK仍然无活性。
CDK 蛋白 T - 环中的苏氨酸位点被磷酸化,并将其酪氨酸位点上的磷酸基团去掉,CDK 蛋白才能发挥其生物学活性
同时,CDK 蛋白还能使细胞中的磷酸酯酶磷酸化,以加速脱去自身酪氨酸位点上的磷酸基团。
有生物活性的周期蛋白 - CDK 复合物能将 DBRP磷酸、化,激活泛素连接酶,把大量泛素加到周期蛋白上并使之迅速降解,CDK 失活,新的周期开始。
CDK 活性受磷酸化和蛋白质水解通路的直接调控
第四节 蛋白质乙酰化对基因表达的影响
核心组蛋白朝向外部的 N 端部分被称为“尾巴 ”,可被组蛋白乙酰基转移酶和乙酰基去乙酰化酶修饰,加上或去掉乙酰基团。
催化组蛋白乙酰化反应的是组蛋白乙酰转移酶(HAT) 。
目前已经发现的 HAT 酶主要有两类:
组蛋白去乙酰化酶负责去除组蛋白上的乙酰基团,目前研究比较深入的是人类中的 HDAC1 和酵母中的 Rpd3 。
组蛋白乙酰化的状态与基因表达有关。组蛋白 N 端 “尾巴 ”上赖氨酸残基的乙酰化中和了组蛋 白尾巴的正电荷,降低了它与 DNA 的亲和性,导致核小体构象发生有利于转录调节蛋白与染色质相结合的变化,从和提高了基因转录的活性。
组蛋白去乙酰化与基因活性的阻遏有关。
组蛋白乙酰基转移酶和去乙酰化酶只能有选择地影响一部分基因的转录。
第五节 激素与热激蛋白对基因表达的影响
一、激素及其影响
许多类固醇激素(如雌激素、孕激素、醛固酮、糖皮质激素和雄激素)以及一般代谢性激素(如胰岛素)的调控作用都是通过起始基因转录而实现的。
体内存在的许多糖皮质类激素应答基因都有一段大约 20bp 的顺式作用元件( 激素应答元件,简 称 HRE) , 该序列具有类似增强子的作用,其活性受激素制约。是 3 种激素应答序列成分保守性分析。靶细胞中含有大量激素受体蛋白,而非靶细胞中没有或很少有这类受体。
固醇类激素的受体蛋白分子有相同的结构框架,包括保守性极高并位于分子中央的 DNA 结合区,位于 C 端的激素结合区和保守性较低的 N 端。如果糖皮质激素受体蛋白激素结合区的某个部分 丢失,就变成一种永久型的活性子,即无需激素诱导也有激活基因转录的作用
( a )小分子激素激活其胞内受体分子的机制;
(b)胞内受体的基本结构分析
多肽激素胰高血糖素接触靶细胞时,首先与受体结合,并激活膜上的腺苷酸环化酶,使之以 Mg2 + - ATP 为底物生成环腺苷酸和焦磷酸。细胞内 cAMP 浓度升高,导致蛋白激酶活性增强,特定酶系的 磷酸化水平及酶活性都得到改善,促进糖原最终分解为葡萄糖 - 1 - 磷酸
二、热激蛋白诱导的基因表达
能与某个(类)专一蛋白因子结合,从而控制基因特异表达的 DNA 上游序列称为应答元件。主要有:
热激应答元件(HSE)
糖皮质应答元件(GRE)
金属应答元件(MRE)
应答元件与细胞内专一 的转录因子相互作用,协调相关基因的转录。
许多生物在最适温度范围以上,能受热诱导合成一 系列热休克蛋白 。受热 后,果蝇细胞内 Hsp70 mRNA 水平提高 1000 倍,就是因为热激因子( HSF) 与 hsp70基因 TATA 区上游 60bp 处的 HSE 相结合,诱发转录起始。
热休克蛋白参与靶蛋白活性和功能的调节,却不是靶蛋白的组成部分,因此,一般称它为分子伴侣或伴侣蛋白。
不受热或其他环境胁迫时,HSF 主要以单体的形式存在于细胞质和核内。单体 HSF 没有 DNA 结合能力,Hsp70 可能参与了维持 HSF 的单体形式。
受热激或其他环境胁迫时,细胞内变性蛋白增多,与 HSF 竞争结合 Hsp70 , 从而释放 HSF , 使之形成三体并输入核内。HSF 的三体能与 HSE 特异结合,促进基因转录。
第六节 其他水平上的表达调控
一、RNA 的加工成熟
各种基因的转录产物都是 RNA , 无论是 rRNA、tRNA 还是 mRNA , 初级转录产物只有经过加工,才 能成为有生物活性功能的活性分子。
rRNA 和 tRNA 的加工成熟
rRNA 加工有两个内容,一个是分子内的切割,另一个是化学修饰。
tRNA 基因的初级转录产物在进入细胞质后,首先经过核苷的修饰,生成 4 . 5S 前体 tRNA , 再行剪接成为成熟的 tRNA(4S) 。
mRNA 的加工成熟
加工包括 mRNA 的 5 ’末端加“帽子 ”,在其 3 ’端加上 polyA , 进行 RNA 的剪接以及核苷酸的甲基 化修饰等。
由于 mRNA 的这些结构与它作为蛋白质合成模板的功能有密切关系,所以是基因表达的重要调控环节。
真核生物基因转录后加工的多样性
简单转录单位
这类基因只编码产生一个多肽,其原始转录产物有时需要加工,有时则不需要加工。这类基因转录后加工有 3 种不同形式。
复杂转录单位
含有复杂转录单位的主要是一些编码组织和发育特异性蛋白质的基因,它们除了含有数量不等 的内含子以外,其原始转录产物能通过多种不同方式加工成两个或两个以上的 mRNA 。
二、翻译水平的调控
在蛋白质生物合成的起始反应中主要涉及细胞中的 4 种装置,包括:
核糖体
蛋白质合成的模板—mRNA
可溶性蛋白因子
tRNA
真核生物 mRNA 的“扫描模式”与蛋白质合成的起始在真核生物起始蛋白质合成时,40S 核糖体亚基及有关合成起始因子首先与 mRNA 模板靠近 5 ’端处结合,然后向 3 ’方向滑行,发现 AUG 起始密码子时,与 60S 大亚基结合形成 80S 起始复合物。
mRNA5 ’端帽子结构的识别与蛋白质合成
因为绝大多数真核生物 mRNA5 ’端都带有“帽子 ”结构,所以,核糖体起始蛋白质的合成,首先面临的问题是如何识别这顶“帽子 ”。真核生物 mRNA5 ’端有 3 种不同的帽子,即 O 型、I 型和Ⅱ型,其主要差别在于帽子中碱基甲基化程度的不同。
mRNA 的稳定性与基因表达调控
高等生物中转运铁蛋白受体( TfR) 和铁蛋白负责铁吸收和铁解毒,其 mRNA 上存在铁应答元件 ( IRE) 。IRE 与 IRE 结合蛋白(IREBP) 相互作用控制了这两个 mRNA 的翻译效率。细胞中能产生两个数量级的蛋白水平差异,却没有在 mRNA 水平上发现显著差异。
可溶性蛋白因子的修饰与翻译起始调控
许多可溶性蛋白因子,即起始因子,对蛋白质合成的起始有着重要的作用,对这些因子的修饰也会影响翻译起始。
eIF - 12 磷酸化对翻译起始的影响
没有氯高铁血红素存在时,兔网织红细胞粗抽提液中的蛋白质合成抑制剂被活化,从而抑制蛋白 质合成。抑制剂 HCI 受氯高铁血红素调节,是 eIF - 2 的激酶,使 eIF - 2 的 “亚基磷酸化,并由活性型 变成非活性型。氯高铁血红素阻断了 HCI 的活化过程。
CBP Ⅱ活性与翻译的起始
在脊髓灰质炎病毒感染的 HeLa 细胞中,有帽子结构的宿主 mRNA 的翻译受阻,宿主蛋白质合成 停止,但没有帽子结构的脊髓灰质炎病毒 mRNA 的翻译却不受影响。宿主细胞 CBPⅡ失活是导致这 种 mRNA 选择性翻译的根本原因。
第七章 分子生物学基本研究法(上)DNA、RNA 及蛋白质操作技术
第一节 重组 DNA 技术发展史上的重大事件
20 世纪分子生物学三大成就:
在 20 世纪 40 年代确定了遗传信息的带者、即基因的分子载体是 DNA 而不是蛋白质,解决了遗传的物质基础问题;
50 年代提出了 DNA 分子的双螺旋结构模型和半保留复制机制,解决了基因的自我复制和世代交替问题;
50 年代末至 60 年代,相继提出了“中心法则 ”和操纵子学说,成功地破译了遗传密码,阐明了遗传信息的流动与表达机制。
重组 DNA 实验中常见的主要工具酶
第二节 DNA 操作技术
一、核酸的凝胶电泳
自从琼脂糖和聚丙烯酰凝胶被引入核酸研究以来,按分子量大小分离 DNA 的凝胶电泳技术,成为一种分析鉴定重组 DNA 分子及蛋白质与核酸相互作用的重要实验手段。
一种分子被放骆到电场中,它就会以一定的速度移向适当的电极。我们把这种电泳分子在电场 作用下的迁移速度,叫做电泳的迁移率,它与电场强度和电泳分子本身所携带的净电荷数成正比,与片段大小成反比。
生理条件下,核酸分子中的磷酸基团呈离子化状态,所以,DNA 和 RNA 又被称为多聚阴离子, 在电场中向正电极的方向迁移。
由于糖-磷酸骨架在结构上的重复性质,相同数量的双链 DNA 几乎具有等量的净电荷,因此它 们能以同样的速度向正电极方向迁移。
琼脂糖凝胶分辨 DNA 片段的范围为 0 . 2 ~ 50kb 之间。聚丙烯酰胺凝胶的分辨范围为 1 到 1000个碱基对之间。凝胶浓度的高低影响凝胶介质孔隙的大小,浓度越高,孔隙越小,其分辨能力就越强。
在凝胶电泳中,加入溴化乙锭( ethidium bromide , EtBr ) 染料对核酸分子进行染色,然后放骆在紫 外光下观察,可灵敏而快捷地检测出凝胶介质中 DNA 的谱带部位,即使每条 DNA 带中仅含有 0 . 05 μg的微量 DNA , 也可以被清晰地检测出来。
溴化乙锭染料的化学结构及其对 DNA 分子的插入作用。 由于插入了溴化乙锭分子,在 紫外光照射下,琼脂糖凝胶电泳中 DNA 的条带便呈现出橘黄色荧光,易于鉴定。
二、核酸的分子杂交
将带有互补的特定核苷酸序列的单链 DNA 或 RNA 混合在一起,其相应的同源区段就会退火形成双链结构。如果退火的核酸来自不同的生物有机体,所形成的双链分子就被称为杂种核酸分子。
经过凝胶电泳分离的 DNA 或 RNA 分子,都必须通过毛细管或电导作用按其在凝胶中的位骆原 封不动地“吸印 ”转移到滤膜上,因此,核酸杂交也被称为 “DNA 印迹杂交 ”。 由于该方法是 E . MSouthern 首先设计出来的,所以又叫做 Southern blotting。
在理想的条件下,应用放射性同位素标记的特异性探针和放射自显影技术,即便每带电泳条带仅含有 2ng 的 DNA 也能被清晰地检测出来。
三、细菌转化
所谓细菌转化,是指一种细菌菌株由于捕获了来自另一种细菌菌株的 DNA 而导致性状特征发生遗传改变的生命过程。提供转化 DNA 的菌株叫作供体菌株,接受转化 DNA 的细菌菌株则被称为受体菌株。
将快速生长中的大肠杆菌骆于经 0℃预处理的低渗氯化钙溶液中,使细胞膨胀形成原生质球,与外源 DNA 形成粘附在细胞表面的复合物。
42℃下做短暂热刺激,复合物便会被细胞所吸收。在全培养基中生长一段时间使转化基因实现表达,就可涂布于选择性培养基中分离转化子。
λ噬菌体作为克隆载体
四、核苷酸序列分析
Sanger 双脱氧链终止法
Sanger 等人于 1977 年发明了利用 DNA 聚合酶的双脱氧链终止原理测定核苷酸序列的方法,该法有时也称为引物合成法或酶催引物合成法。
它利用了 DNA 聚合酶的两种酶催反应特性:
能够利用单链的 DNA 作模板,合成出准确的 DNA 互补链;
能够利用 2 ′,3 ′- 双脱氧核苷三磷 酸作底物,将其掺入到寡核苷酸链的 3 ′- 末端,从而终止 DNA 链的生长。
脱氧核苷三磷酸(dNTP)和双脱氧核苷三磷酸(ddNTP) 的分子结构式。DNA 合成中,5 ’ →3 ’磷酸二酯键的形成需要 3 ’- OH 参与,因此 ddNTP 的掺入会导致 DNA 链合成的终止
每个反应中都加入一种不同的 ddNTP 和全部 4 种 dNTP , 其中一种带有 35P 同位素标记。反应混 合物样品加到聚丙烯酰胺胶中,进行电泳分离。电泳凝胶用 X 光底片作放射自显影曝光,产生出可见 的谱带。从胶的底部开始判读谱带,逐渐读向顶部。所得的核苷酸序列是同模板链碱基序列互补的。
Maxam - Gilbert 化学修饰法:
用化学试剂处理末端放射性标记的 DNA 片段,特异性切割碱基,产生一组各种不同长度的 DNA 片段的混合物,经电泳分离和放射自显影之后,根据 X 光片上所显现的相应谱带,判定 DNA 序列。
在碱性的条件下,肼(NH2·NH2)能够从 C4 和/或 C6 原子位骆作用于胸腺嘧啶和胞嘧啶碱基, 环化形成新的 5 原子环。有六氢吡啶存在时,通过 β- 消除反应,释放 2 个磷酸分子并在这个核苷酸 位骆上发生 DNA 链的断裂。
硫酸二甲酯是一种碱性的化学试剂,能使 DNA 碱基环中的氮原子发生甲基化反应。
在中性 pH 条件下,鸟嘌呤和腺嘌呤残基上的甲基化足以导致配糖键发生水解,DNA 链断裂。 加入六氢吡啶后,就只在 G 而不是 A 残基上发生 DNA 链的断裂。
在酸性环境中,因嘌呤碱基的质子化作用导致脱嘌呤效应,会使配糖键发生水解,再 经过六氢吡啶催化的 β- 消除作用移去磷酸分子,于是就会在这个位点上发生 DNA 链的断裂。这一 反应是嘌呤碱基特异的。
DNA 序列分析的自动化
包括两个方面:即“分析反应 ”的自动化和“读片过程 ”的自动化。
大多采用四甲基若丹明作为荧光剂,预先标记引物 DNA 。带有这种引物的 DNA 片段能在激光诱导下发出荧光,从而取代同位素标记。
在电泳凝胶的侧面,固定一个激光通道小孔,在凝胶板的上面装荧光信号接收器。 当 DNA 条带 在电场的作用下经过激光通道小孔时,带有荧光剂标记的 DNA 受激发产生荧光。荧光感受器收到荧光信号后,转换数据,判定核酸序列。
DNA 杂交测序法(SBH )
它利用一组已知序列的寡核苷酸短序列作探针,同某一特定的较长的靶 DNA 分子进行杂交,从而测定其核苷酸的序列。
DNA 杂交测序法,没有繁琐的凝胶电泳,不需要核酸酶,不需要进行复杂的化学反应,十分适合于大规模 DNA 序列分析。
DNA 杂交测序包括两个步骤:
将待测定的靶 DNA 分子同一组已知其核苷酸顺序的寡核苷酸探针进行杂交。
与能够同靶 DNA 形成完全的双链杂合分子的寡核苷酸探针做比较分析,并据此推算出靶 DNA的核苷酸序列。
如果将 5 ’- AGCCTAGCTGAA - 3 ’的 12 - mer 靶 DNA , 与完全随机的 8 - mer 寡核苷酸探针杂 交,在总数为 48 = 65 536 种的 8 - mer 探针群体中,仅有 5 种会与靶 DNA 形成完全互补的双链体。根 据这 5 种完全杂交的 8 - mer 探针之间的重叠关系,便可推算出靶 DNA 分子的核苷酸序列。
五、基因扩增
首先将双链 DNA 分子加热分离成两条单链,DNA 聚合酶以单链 DNA 为模板并利用反应混合物中的四种 dNTP 合成新生的 DNA 互补链。
因为 DNA 聚合酶需要有一小段双链 DNA 来启动( “引导 ”)新链的合成,所以,新生 DNA 链的起点由寡核苷酸引物在模板 DNA 链两端的退火位点所决定。
整个 PCR 反应的全过程,即 DNA 解链(变性)、引物与模板 DNA 相结合(退火)、DNA 合成(链的 延伸)三步,可以被不断重复。经多次循环之后,反应混合物中所含有的双链 DNA 分子数,即两条引物结合位点之间的 DNA 区段的拷贝数,理论上的最高值应是 2n 。
主要步骤:
将含有待扩增 DNA 样品的反应混合物放骆在高温( > 94℃) 环境下加热 1 分钟,使双链 DNA变性,形成单链模板 DNA 。
然后降低反应温度(约 50℃) , 致冷 1 分钟,使寡核苷酸引物与两条单链模板 DNA 发生退火作用并结合在靶 DNA 区段两端的互补序列位骆上。
最后,将反应混合物的温度上升到 72℃保温 1 - 数分钟,在 DNA 聚合酶的作用下,从引物的 3 ′ - 端加入脱氧核苷三磷酸,并沿着模板分子按 5 ′→3 ′方向延伸,合成新生 DNA 互补链。
聚合酶链式反应示意图
( a )起始材料,双链 DNA ;
(b)反应混合物加热后发生链分离,降温使引物结合到待扩增靶 DNA 区段两端的退火位点上;
( c )Taq 聚合酶以单链 DNA 为模板在引物的引导下利用反应混合物中的 dNTPs 合成互补的新链DNA ;
(d)将反应混合物再次加热,使旧链和新链分开
常规 PCR 技术能扩增两引物之间的 DNA 区段,然而,有时我们也希望扩增位于靶 DNA 区段之外的未知 DNA 序列,这就需要应用反向 PCR技术。
先用一种在靶 DNA 区段上没有识别位点的核酸内切限制酶,从距靶 DNA 区段有一定距离的两 侧位骆切割 DNA 分子,然后将这些片段作分子内连接成环形。根据已知的靶 DNA 序列按向外延伸的要求设计一对向外引物,保证被扩增的是位于靶 DNA 区段两侧的未知 DNA 序列。
反向 PCR 的基本操作程序
波纹线表示靶 DNA 区段,箭头表示限制性内切酶位点,分别用方框表示包围靶 DNA 区段的左侧序列和右侧序列。
( a )用一种在靶序列上没有切点的核酸限制性内切酶消化大分子量 DNA;
(b)产生大小不同的线性 DNA 片段群体,其中靶 DNA 区段的 DNA 分子长度不超过 2 ~ 3kb , 经连接后重新环化;
( c )按靶序列设计的一对引物与互补序列退火结合,其延伸方向如箭头所指;
(d)经 PCR 扩增产生的主要是线性双链 DNA 分子,它是由左侧序列和右侧序列首尾连接而成,其接点是( a )中所用的限制性内切酶的识别位点。
第三节 基因克隆的主要载体系统
一、质粒 DNA 及其分离纯化
细菌质粒是存在于细胞质中的一类独立于染色体并能自主复制的遗传成份,绝大多数质粒都是由环形双链 DNA 组成的复制子。
质粒 DNA 仅占细胞总 DNA 的 1% ~ 2% , 其化学结构与寄主染色体 DNA 之间并没有什么差别。 实验表明,在 DNA 分离过程中,染色体 DNA 容易断裂成较小的线性片段,而质粒 DNA 由于其分子量较小、结构紧密,仍能保持完整状态。
氯化铯密度梯度离心法
在大肠杆菌裂解液中加入 EtBr - 氯化铯溶液,使 EtBr 分子嵌入到 DNA 链上,导致双螺旋结构发 生解旋反应。线性的染色体 DNA 大片段及开环的质粒 DNA 分子具有游离的末端而易于解旋,可结合大量的 EtBr 分子。共价闭合环状的 DNA 分子,只能发生有限的解旋反应,结合少量的 EtBr 分子。 在 D NA - EtBr 复合物中,结合的 EtBr 分子数量越多,其密度也就越低。
因此,在 EtBr 达到饱和浓度的条件下,质粒 DNA 就要比线性的染色体 DNA 片段具有更高的密度。通过氯化铯密度梯度离心之后,它们就会被平衡在不同的位置,从而达到纯化质粒 DNA 的目的。
应用 Cs Cl - EtBr 密度梯度离心技术可直接在紫外光下观察到被分离的不同 DNA 分子。 染色体 DNA 带中,可能也含有一定数量的线性质粒 DNA 分子。
碱变性法
在 pH 值 12 . 0 ~ 12 . 5 时加热 DNA 溶液,线性 DNA 会被变性,两条链完全分开。 闭合环状质粒 DNA 不会被变性,尽管连接 DNA 互补链之间的氢键也会断开,但由于闭合环状质粒 DNA 的双螺旋主 链彼此盘绕,两条链仍然结合在一起。致冷或恢复中性 pH 后,共价闭合环状的质粒 DNA 能迅速而准确地复性。
二、重要的大肠杆菌质粒载体
pSC101 质粒载体
是一种严紧型复制控制的低拷贝数的大肠杆菌质粒载体,平均每个寄主细胞仅有 1 ~ 2 个拷贝。 编码有四环素抗性基因( tetr) , 具有 EcoRI、HindIII、BamHI、SalI、XhoI、PvuII 以及 SmaI 等 7 种限制性核 酸内切酶的单切割位点,在 HindIII、BamHI 和 SalI 等 3 个位点克隆外源 DNA , 都会导致 tetr 基因失活。
pSC101 质粒有可插入外源 DNA 的多个内切酶单克隆位点和四环素抗性强选择记号,是第一个真核基因克隆载体。
缺点:它是一种严紧型复制控制的低拷贝质粒,从带有该质粒的寄主细胞中提取 pSC101 DNA , 产量很低。
C olE1 质粒载体
C olE1 质粒属于松弛型复制控制的多拷贝质粒。正常条件下,当培养基中氨基酸被耗尽,或是在 对数生长末期的细胞培养物中加入氯霉素以抑制蛋白质的合成,寄主染色体 DNA 的复制便被抑制, 细胞的生长也随之停止。C olE1 质粒仍然可以继续进行复制达数小时之久,使每个寄主细胞中所累积的 ColE1 质粒拷贝数增加到 1000 ~ 3000 个之多,质粒 DNA 大约可占细胞总 DNA 的 50% 左右。
pBR322 质粒载体
由三个不同来源的部分组成的:第一部分来源于 pSF2124 质粒易位子 Tn3 的氨苄青霉素抗性基 因( ampr) ; 第二部分来源于 pSC101 质粒的四环素抗性基因( tetr) ; 第三部分则来源于 ColE1 的派生质 粒 pMB1 的 DNA 复制起点( ori) 。
pBR322 质粒载体优点是具有较小的分子量,其长度为 4 363bp 。不仅易于纯化,而且即使携带上 一段 6 - 8kb 的外源 DNA 片段,操作起来仍较为便利。
具有两种抗生素抗性基因以用作转化子的选择记号。有较高的拷贝数,若经过氯霉素扩增,每个细胞中可累积 1000 ~ 3000 个拷贝,为重组体 DNA 的制备提供了极大的方便。
pUC 质粒载体(包括四个部分)
来自 pBR322 质粒的复制起点( ori) ;
氨苄青霉素抗性基因( ampr) ;
大肠杆菌 β- 半乳糖酶基因( lacZ) 的启动子及其编码 “-肽链的 DNA 序列,此结构特称为lacZ ’基因
位于 lacZ ’基因中的靠近 5 ’- 端的一段多克隆位点( MCS) 区段,外源基因插入后破坏了lacZ ’基因的功能。
pUC 质粒载体优点:
更小的分子量和更高的拷贝数。在 pBR322 基础上构建 pUC 质粒载体时,仅保留下其中的氨苄 青霉素抗性基因及复制起点,其分子小了许多,pUC8 为 2750bp , pUC18 为 2686bp 。 由于缺失 rop 基因,pUC 质粒不经氯霉素扩增时,平均每个细胞即可达 500 ~ 700 个拷贝。
pGEM - 3Z 质粒
长度为 2743bp , 编码有一个氨苄青霉素抗性基因和一个 lacZ ′基因。含有两个噬菌体启动子( T7 和 P6 ) , 为 RNA 聚合酶的附着作用提供了特异性的识别位点。加入 T7 或 SP6 RNA 聚合酶,所克隆的外源基因便会转录出相应的 mRNA 。
穿梭质粒载体
指由人工构建的具有两种不同复制起点和选择记号,可在两种不同的寄主细胞中存活和复制的 质粒载体。 由于这类质粒载体可以保证外源 DNA 序列在不同物种的细胞之间得到扩增,能在原核和真核细胞之间往返穿梭,具有广泛的用途
三、λ噬菌体载体
分为溶菌周期和溶源周期两种不同的类型:
在溶菌周期,噬菌体将其感染的寄主细胞转变成为噬菌体的“制造厂 ”,产生出大量的子代噬菌体颗粒。将只具有溶菌生长周期的噬菌体叫作烈性噬菌体。
溶源生长周期是指在感染过程中没有产生出子代噬菌体颗粒,噬菌体 DNA 被整合到寄主细胞染色体 DNA 上,成为它的一个组成部分。具有这种溶源周期的噬菌体,叫作温和噬菌体。
λ噬菌体的分子量为 48 . 5kb , 是温和噬菌体。λ噬菌体有 61 个基因,其中约一半参与了生命周 期的调控,是 λ噬菌体的必需基因;另一部分基因则被称为非必需基因,被外源基因取代后不影响生命周期。
在 λ噬菌体线性 DNA 分子的两端,各有一条由 12 个核苷酸组成的完全互补的 5 ‘突出序列(即粘性末端),注入到寄主细胞内的 λ噬菌体的线性 DNA 分子,会迅速地通过粘性末端之间的互补作用,形成环形双链 DNA 分子,并进一步超盘绕。
这种粘性末端结合形成的双链区段称为 cos 位点
第四节 基因的分离与鉴定
克隆
在高等生物个体水平上,克隆表示由具有相同基因型的同一物种的两个或数个个体组成的群体。从同一受精卵分裂而来的单卵双生子便是属于同一克隆。
在细胞水平上,克隆一词是指由同一个祖细胞分裂而来的一群遗传上同一 的子细胞群体。
在分子生物学上,人们把将外源 DNA 插入具有复制能力的载体 DNA 中,使之得以永久保存和复制这种过程称为克隆
基因克隆,包括目的基因的分离和鉴定两个内容,分四个基本步骤:
DNA 材料的选择与片段化
外源 DNA 片段与载体分子的体外连接反应
将人工重组的 DNA 分子导入它们能够进行正常复制的寄主细胞
重组转化子克隆的选择或筛选。
一、DNA 片段的产生与分离
由于高等真核生物的基因组庞大,按一般载体承受外源 DNA 插入能力(大约为 1000 ~ 3000bp)计算,能产生几十万个大小不同的 DNA 片段,形成由几十万个大小不同的重组体分子组成的克隆群体。
二、重组体 DNA 分子的构建
外源 DNA 片段定向插入载体分子
用两种不同的限制性核酸内切酶同时消化特定的 DNA 分子,将产生不同粘性末端的 DNA 片段。如果载体分子和待克隆的 DNA 分子都用同一对限制性核酸内切酶切割,载体和外源 DNA 片段将按一种取向连成重组 DNA 分子,保证外源 DNA 片段定向插入载体分子。
应用 BamHI 接头构建重组体分子的基本程序。 由于接头分子具有 5 ′- OH , 不会发生自 身聚合作用。加到外源 DNA 片段上的接头分子,通过多核苷酸激酶的催化作用被重新磷酸化,然后同经酶切的载体分子连接,形成重组分子。
重组子导入受体细胞的途径
将外源重组体分子导入受体细胞的主要途径包括转化(或转染)、转导、显微注射和电穿孔等。转 化和转导主要适用于细菌一类原核细胞和酵母等低等真核细胞,而显微注射和电穿孔则主要应用于 高等动物的真核细胞。
三、cDNA 基因克隆
cDNA 克隆的过程是通过一系列酶催作用,使总 poly(A) mRNA 转变成双链 cDNA 群体并插入到 适当的载体分子上,转化大肠杆菌寄主菌株细胞,构成包含所有基因编码序列的 cDNA 基因文库。可 应用 PromegaPolyATtractmRNA 分离系统分离多聚(A) mRNA 。将用生物素标记的寡聚(dT) 引物与细 胞总 RNA 共温育,加入与微磁球相连的抗生物素蛋白,用磁场吸附通过寡聚(dT) 引物与抗生物素蛋白及强力微磁球相连的 mRNA 。
四、克隆基因的分离
应用核酸探针克隆目的基因
把基因文库转移到尼龙膜或硝酸纤维素滤膜上,就可以与特异性的核酸探针进行菌落或噬菌斑 杂交,以便筛选出具有目的基因的阳性克隆,这个过程叫作克隆基因的分离或筛选。
应用 mRNA 差别显示技术克隆目的基因
不同基因在生物个体发育的不同阶段或不同的组织、细胞中发生的按时间、空间进行有序表达的 方式称为基因的差别表达 。1992 年,美国波士顿 Dena - Farber 癌症研究所的科 学家发明了 mRNA 的差别显示技术,简称 DDRT - PCR , 可以从一对不同基 因型的细胞群体所产生的约 15 000 种 mRNA 中有效地鉴定并分离出差别表达的基因。
应用 RDA 法进行分子克隆
该法通过降低cDNA 群体复杂性和更换cDNA 两端接头等方法,特异性扩增目的基因片段。因为 Tester 和 Driver 在接受差示分析前均经一个 4 碱基切割酶处理,形成平均长度 256bp 的代表群,保证绝大部分遗传信息能被扩增。
cDNA RACE( cDNA 末端快速扩增)
是用于从已知 cDNA 片段扩增全长基因的方法,它根据已知序列设计基因片段内部特异引物,由 该片段向外侧进行 PCR 扩增得到目的序列。用于扩增 5 ’端的方法称为 5 ’RACE , 用于扩增 3 ’端的称为 3 ’RACE 。
基因的图位克隆法
所有具有某种表现型的基因都可以通过该方法克隆得到。首先,通过构建遗传连锁图,将目的基 因定位到某个染色体的特定位点,并在其两侧确定紧密连锁的 RFLP 或 RAPD 分子标记。通过对许多 不同的生态型及大量限制性内切酶和杂交探针的分析,找出与目的基因距离最近的 RFLP 标记,通过染色体步移技术将位于这两个标记之间的基因片段克隆并分离出来。
第八章 分子生物学研究法(下)—基因功能研究技术
第一节 基因表达研究技术
一、基因表达系列分析技术
基因表达系列分析技术( SAGE)是以 DNA 序列测定为基础分析 全基因组表达模式的技术。任何长度超过 9 - 10 个碱基的核苷酸片段都可能代表一种特异性的转录 产物,因此,根据某个序列占总标签数的比例就可分析所对应基因的表达频率。
常规 SAGE 方法( short SAGE)基本流程
二、RNA 的选择性剪接技术
RNA 的选择性剪接是指用不同的剪接方式从一个 mRNA 前体产生不同的 mRNA 剪接异构体的过程。可分为:平衡剪切、5 ’选择性剪切、3 ’选择性剪切、外显子遗漏型剪切及相互排斥性剪切
三、原位杂交技术
原位杂交( ISH)是用标记的核酸探针,经放射自显影或非放射检测体系,在 组织、细胞、间期核及染色体上对核酸进行定位和相对定量研究的一种手段,分为 RNA 原位杂交和荧光原位杂交。
RNA 原位杂交:用放射性或非放射性(如地高辛、生物素等)标记的特异性探针与被固定的组织 切片反应,若细胞中存在与探针互补的 mRNA 分子,两者杂交产生双链 RNA , 可通过放射性标记或经酶促免疫显色,对该基因的表达产物做出定性定量分析。
荧光原位杂交( FISH) . 首先对寡核苷酸探针做特殊的修饰和标 记,然后用原位杂交法与靶染色体或 DNA 上特定的序列结合,再通过与荧光素分子相耦联的单克隆抗体来确定该 DNA 序列在染色体上的位置
四、基因定点突变
通过改变基因特定位点核苷酸序列来改变所编码的氨基酸序列,用于研究某个(些)氨基酸残基对蛋白质的结构、催化活性以及结合配体能力的影响,也可用于改造 DNA 调控元件特征序列、修饰表达载体、引入新的酶切位点等。
寡核苷酸介导的 DNA 突变技术
目前,主要采用两种 PCR 方法:重叠延伸技术、大引物诱变法,在基因序列中进行定点突变。
PCR 介导的定点突变方法的优势:
突变体回收率高
能用双链 DNA 作为模板,可在任何位点引入突变
可在同一试管中完成所有反应
快速简便
第二节 基因敲除技术
一、基本原理
经典遗传学是从一个突变体的表型出发,研究其基因型,进而找出该基因的编码序列。现代遗传学( , 反向遗传学)首先从基因序列出发,推测其表现型,进而推导出该基因的功能。
基因敲除又称基因打靶,通过外源 DNA 与染色体 DNA 之间的同源重组,进行 精确的定点修饰和基因改造,具有专一性强、染色体 DNA 与目的片段共同稳定遗传等特点。
基因敲除可分为:
完全基因敲除,是指通过同源重组法完全消除细胞或者动物个体中的靶基因活性
条件型基因敲除(又称不完全基因敲除),是指通过定位重组系统实现特定时间和空间的基因敲除。
噬菌体的 Cre/Loxp 系统、Gin/Gix 系统、酵母细胞的 FLP/FRT 系统和 R/RS 系统是现阶段常用的四种定位重组系统,尤以 Cre/Loxp 系统应用最为广泛。
由于基因转移的同源重组自然发生率极低,动物的重组概率约为 10 - 2 ~ 10 - 5 , 植物的概率为 10 - 4 ~ 10 - 5 , 即使采用双向选择法也很难保证一次就从众多细胞中筛选出真正发生了同源重组的 胚胎干细胞,得用多种分子筛选技术验证所获得的确实是目的基因被敲除的细胞系。
二、高等动物基因敲除技术
真核生物基因敲除的技术路线主要包括构建重组基因载体,用电穿孔、显微注射等方法把重组 DNA 导入胚胎干细胞纯系中,使外源 DNA 与胚胎干细胞基因组中相应部分发生同源重组,将重组载体中的 DNA 序列整合到内源基因组中并得以表达。
显微注射命中率较高,技术难度相对大些。电穿孔法命中率比显微注射低,操作使用方便。
胚胎干细胞(ES 细胞)分离和体外培养的成功奠定了哺乳动物基因敲除的技术基础。
三、植物基因敲除技术
T - DNA 插入失活技术是目前在植物中使用最为广泛的基因敲除手段。
利用根癌农杆菌 T - DNA 介导转化,将带有报告基因的 DNA 序列整合到基因组 DNA 上,如果这 段 DNA 插入到目的基因内部或附近,就会影响该基因的表达,从而使该基因“失活 ”。
植物基因敲除及突变体筛选
a. 引物设计:LP 和 RP 分别代表插入基因两端的引物,LB 是指载体上的一段引物,目的基因片段(设为 900bp) 。旁邻序列是经测序后获得的 DNA 序列。
b . PCR 产物电泳结果:分别代表野生型、杂合子和纯合子 PCR 条带。
第三节 蛋白质及 RNA 相互作用技术
一、酵母单杂交系统
是上世纪 90 年代中发展起来的研究 DNA - 蛋白质之间相互作用的新技术,可识别稳定结合于 DNA 上的蛋白质,在酵母细胞内研究真核生物中 DNA - 蛋白质之间的相互作用,并通过筛选 DNA 文 库直接获得靶序列相互作用蛋白的编码基因。
将已知顺式作用元件构建到最基本启动子的上游,把报告基因连接到Pmin 下游。将编码待测转录因子 cDNA 与已知酵母转录激活结构域( AD)融合表达载体导入酵母细胞,该基因产物如果能够与顺式作用元件相结合,就能激活 Pmin 启动 子,使报告基因得到表达。
二、酵母双杂交系统
真核生物转录调控因子具有组件式结构特征,这些蛋白往往由两个或两个以上相互独 立的结构域,其中 DNA 结合结构域(BD)和转录激活结构域( AD) 是转录激活因子发挥功能所必须的。
BD 能与特定基因启动区结合,但不能激活基因转录,由不同转录调控因子的 BD 和 AD 所形成的杂合蛋白却能行使激活转录的功能。
酵母双杂交技术原理示意图
三、体外蛋白质相互作用技术
Far Western 印迹技术
用 32P 标记的体外表达蛋白作探针,直接检测与该蛋白发生相互作用的蛋白或表达该蛋白的 cD-NA 。
GST 融合蛋白沉降技术
利用 GST 对谷胱甘肽偶联的琼脂糖球珠的亲和性,从混合蛋白质样品中纯化得到相互作用蛋白 。
蛋白质芯片技术
蛋白质芯片可以用来大规模筛选蛋白之间的相互作用。将荧光标记的探针蛋白与蛋白质芯片孵育,洗脱非特异性结合的蛋白后,可以通过扫描芯片上的荧光点检测到稳定的相互作用蛋白点。
等离子表面共振技术
将诱饵蛋白结合于葡聚糖表面并固定于纳米级厚度的金属膜上。当蛋白质混合物经过时,如果 有蛋白质同“诱饵 ”蛋白发生相互作用,那么两者的结合将使金属膜表面的折射率上升,导致共振角度的改变。
免疫共沉淀技术
将靶蛋白的抗体连接到固体基质上,再将可能与靶蛋白发生相互作用的待筛选蛋白加入反应体 系中,用低离心力沉淀或微膜过滤法在固体基质和抗体的共同作用下将蛋白复合物沉淀到试管的底部或微膜上。
四、RNAi 技术及其应用
RNAi 技术利用双链小 RNA 高效、特异性降解细胞内同源 mRNA 从而阻断靶基因表达,使细胞出现靶基因缺失的表型。RNAi 的命名来源于安德鲁·法尔 1998 年在《自然》杂志上的论文。
研究发现,双链 RNA 是 RNAi 的触发物,引发与之互补的单链 RNA 的降解。经过 Dicer( 一种具有 RNAase III 活性的核酸酶)的加工,细胞中较长的双链 RNA(30个核苷酸以上)首先被降解形成 21 ~ 25 个核苷酸的小分子干扰核糖核酸并有效地定位目标 mRNA 。
siRNA 是引发转录后基因沉默中序列特异性 RNA 降解的重要中间媒介,它具有特殊的结构特征, 即 5 ’端磷酸基团和 3 ’端的羟基,其两条链的 3 ’端各有两个碱基突出于末端。 由 siRNA 中的反义链 参与指导合成被称为 RNA 诱导的沉默复合体(RISC)的核蛋白体,再由 RISC 介导切割目的 mRNA 分子中与 siRNA 反义链互补的区域,从而实现干扰靶基因表达的功能
第四节 基因芯片及数据分析
一、基因芯片技术原理
基因芯片 , 又称 DNA 微阵列技术是能同时监测大量靶基因表达的实验手段,从而迅速准确地在基因组水平上阐述不同生物组织或细胞中各种转录本的变化规律。
把大量已知或未知序列的 DNA 片段点在尼龙膜或玻璃片上,再经过物理吸附作用达到固定化。 也可以直接在玻璃板或金属表面进行化学合成,得到寡聚核苷酸芯片。将芯片与待研究的 cDNA 或 其他样品杂交,经过计算机扫描和数据处理,便可以观察到成千上万个基因在不同组织或同一组织不同发育时期或不同生理条件下的表达模式。
基因芯片的工作流程:
简易基因芯片
简易芯片一般基因数量少( 一般不超过 2000) , 主要用于研究小部分特定基因的表达状态。可用手工制作或者机械手点样。
大规模基因芯片
通常涉及基因组规模与数量( 一般大于 10000 个基因),分别采用接触式点样,非接触式点样或者半导体技术制备样品。
微珠芯片技术
在包含 50000 根光纤的直径为 3 . 5 mm 光纤束中,每根光纤顶部蚀刻出的小洞可镶嵌 3 μm 的微磁珠,每个微磁珠上可据要求连接不同的配体。配体可与荧光标记的配体发生相互作用,发生的信号被激发后通过光纤传递到检测器。
微珠芯片的优势:
密度高
测试重复性好
定制方便
微珠芯片的用途:
SNP 及基因型分析;
基因表达谱分析
蛋白组学研究
二、基因芯片数据分析
数据可靠性分析
生物学意义分析
主要指通过分析芯片杂交数据,研究差异表达基因的生物学意义。
将差异表达定位于不同的生物化学代谢途径,研究基因芯片数据中可能具有生物学意义的代谢途径。
第五节 利用酵母鉴定靶基因功能
一、酵母的遗传学
酵母菌是单细胞真核生物,具有与动植物细胞相似的结构特征。酿酒酵母有稳定的单倍体和二 倍体细胞,是最早完成基因组 DNA 全序列测定的真核生物。导入酵母细胞中的 DNA 即能以自主复 制的分子形式存在,也可被整合到基因组的方式存在。酵母中转化 DNA 的整合重组主要通过同源重组方式进行,整合效率较高。
酵母单倍体和二倍体的差异:
二倍体细胞直径大约是单倍体的 1 . 3 倍。
二倍体细胞呈长形或卵圆形,单倍体细胞通常接近圆形。
二倍体细胞按极性方向出芽,单倍体细胞按轴线方向出芽,即出芽方式不同
扫描电镜下的酵母细胞
a. 新芽通常在已脱落的芽斑附近长出来;BS , 芽痕;BirS , 蒂痕;b . 子细胞脱落后的芽斑放大图
酵母细胞有三种交配型:
MATa , MAT“, MATa/ℼ。单倍体不能与前两种中的任何一种细胞交配。
二倍体酵母细胞在营养缺乏的条件下能通过减数分裂形成单倍体的孢子。
从单个孢子来源的所有细胞都带有一套相同的染色体 DNA
二、酵母基因转化与性状互补
利用 Yip 可以对酵母基因组中的任意基因进行精确的敲除( 置换),带有致死位点和可能的外源功能互补基因的酵母二倍体细胞在饥饿条件下形成四分体孢子,通过四分体分析技术进行观测和研 究。如果引入的外源基因具有互补突变点的功能,含有突变基因的单倍体可以存活,否则就不能存活
三、外源基因在酵母中的功能鉴定
将外源基因克隆于酵母表达载体上,转化野生型或突变酵母菌株,通过观察酵母的表型变化或分 析细胞中化学成分的变化即可推测该基因的生物学功能
四、其它分子生物学技术
凝胶滞缓实验
凝胶滞缓试验 , 又叫作 DNA 迁移率变动试验, 是用于体外研究 DNA 与蛋白质相互作用的一种特殊的凝胶电泳技术。在凝胶电泳中,由于电场的作用,裸露的 DNA 朝正电极移动的距离与其分子量的对数成反比。
如果此时 DNA 分子与某种蛋白质相结合,那么,由于分子量增大,它在凝胶中的迁移作用会受到阻滞,在特定电压和时间内朝正电极移动的距离也就相应缩短了。
噬菌体展示技术
噬菌体可被分为溶菌周期和溶源周期两种不同的类型。在溶菌周期,噬菌体将其感染的宿主细 胞转变成为噬菌体的“制造厂 ”,产生出大量的子代噬菌体颗粒。实验室常将只具有溶菌生长周期的噬菌体叫作烈性噬菌体。
溶源生长周期是指噬菌体 DNA 被整合到宿主细胞染色体 DNA 上,成为它的一个组成部分,感染过程中不产生子代噬菌体颗粒。具有这种溶源周期的噬菌体被称为温和噬菌体。
噬菌体展示技术的基本原理是将编码“诱饵 ”蛋白的 DNA 片段插入噬菌体基因组,并使之与噬菌 体外壳蛋白编码基因相融合。重组噬菌体侵染宿主细菌后,复制形成大量带有杂合外壳蛋白的噬菌体颗粒,直接用于捕获靶蛋白库中与“诱饵 ”相互作用的蛋白质。
噬菌体展技术研究蛋白质相互作用
DNaseI 足迹试验
首先将待检测的双链 DNA 分子用 32P 作末端标记,并用限制性内切酶去掉其中的一个末端,得 到只有一条链的单个末端标记的双链 DNA 分子,与细胞蛋白质提取物混合。加入少量 DNaseI(随机 切割 DNA)消化 DNA 分子,保证平均每条 DNA 链只发生一次磷酸二酯键断裂。如果蛋白质提取物中 不存在与 DNA 结合的特异蛋白质,经 DNaseI 消化之后便会产生出距放射性标记末端 1 个、2 个、3 个核苷酸等等一系列前后长度均仅相差一个核苷酸的连续的 DNA 片段梯度群体。
如果有蛋白质结合到 DNA 分子的某一区段上,它就将保护该 DNA 区段免受 DNaseI 的消化作用, 不能产生出相应长度的切割条带。
蛋白激酶和蛋白磷酸化酶催化底物蛋白发生可逆化磷酸化
在电泳凝胶放射自显影图片上,相应于蛋白质结合的部位不出现放射性标记的条带,出现了被称为“足迹 ”的空白区
蛋白质磷酸化分析技术由于细胞内可能有多达上千个蛋白激酶,体内检测某个蛋白激酶活性非 常困难,科学家常用体外激酶活性分析法来检测蛋白激酶活性。该方法能十分可靠地鉴定某个蛋白 激酶对底物的磷酸化作用,筛查激酶的特异性底物。
第六节 其他分子生物学
第九章 疾病与人类健康
第一节 肿瘤与癌症
癌
是一群不受生长调控而繁殖的细胞,也称恶性肿瘤良性肿瘤则是一群仅局限在自己的 正常位置,且不侵染周围其它组织和器官的细胞。绝大多数癌是由肿瘤细胞经过一系列突变转化而来的
癌基因可分为两大类
病毒癌基因, 编码病毒癌基因的主要有 DNA 病毒和 RNA 病毒
①DNA 病毒包括乙型肝炎病毒、SV40 和多瘤病毒、乳头瘤病毒、腺病毒、疱疹病毒和痘病毒
②RNA 病毒主要是反转录病毒。反转录病毒致癌基因可能是研究最多的病毒基因,它们能使靶细胞发生恶性转化
细胞转化基因 , 它们能使正常细胞转化为肿瘤细胞,这类基因与病毒癌基因 有显著的序列相似性。
一、反转录病毒致癌基因
1910 年发现带有单链 RNA 肉瘤病毒( 一种反转录病毒)的鸡肉瘤无细胞滤液能在鸡体内诱发新的肉瘤。
这种病毒的基因组只有 6 - 9kb 。RNA 上的基因数目很少,它们被包裹在由 gag 和 env 两个基因 编码的蛋白质外壳中,其中 env 基因指导外壳蛋白的合成,gag 基因则指导 “鞘 ”蛋白的合成,这些“鞘 ”蛋白好像“道钉 ”一样“箍 ”在外壳的表面,维持外壳蛋白结构的稳定性。
该肉瘤病毒反转录酶以病毒 RNA 为模板,转录出单链 DNA 分子,利用宿主 DNA 聚合酶指导合成 第二条 DNA 链,以双链 DNA 形式整合到宿主细胞基因组中。被整合的反转录病毒 DNA 分子称为原病毒 , 它能指导病毒 mRNA 合成。
肉瘤病毒 V - Src 基因,编码有 514 个氨基酸的 p60Src 磷酸化蛋白,其 C 端 250 个氨基酸是活性 区域,负责将磷酸基团转移到酪氨酸残基上。它的作用主要是使多个靶蛋白发生磷酸化,从而影响它们的功能,加速细胞癌变的过程。
科学家发现,一种存在于细胞质膜附着点内被称为枢纽蛋白 的细胞骨架蛋白的磷酸化可能是引起细胞癌变的中心环节。
质膜附着点的主要作用是通过细胞膜固着蛋白,将细胞固定在所处的表面,肌动蛋白纤丝也依附在上面。位于附着点内的枢纽蛋白则起着连接肌动蛋白纤丝束和细胞膜固着蛋白的作用。
正常情况下,该蛋白上的酪氨酸残基只有轻度的磷酸化。
转化细胞中,由于 p60Src 结合在附着点内靠近或位于枢纽蛋白处,使这一蛋白的磷酸化水平提高了 20 倍以上,明显降低了枢纽蛋白连接肌动蛋白纤丝束和细胞膜固着蛋白的功能,导致肌动蛋白纤丝束松散,细胞粘附能力减弱,容易发生脱落和转移
V - onc 基因的起源
反转录病毒基因组中所带有的 onc 基因并非来自病毒本身,而是这些病毒在感染动物或人体之后获得的细胞原癌基因。
动物或人原癌基因经病毒修饰和改造后,成为病毒基因组的一部分并具有了致癌性,其作用的靶分子也往往发生改变
二、原癌基因产物及其分类
除了病毒感染外,许多非病毒因子(如放射性物质、化学试剂亚硝酸、烷化剂等)也能诱导细胞转 化。这些因子并没有把致癌基因或其他致癌的遗传信息带入细胞,而仅仅通过某种激活机制改变了 细胞内原有的遗传信息(内源基因发生突变),使细胞发生恶性转化。
三、原癌基因的表达调控
癌基因在正常细胞中通常以单拷贝形式存在,只有低水平的表达或根本不表达。在很多情况下, 原癌基因的结构发生了点突变或插入、重排、缺失及扩增等,改变其转录活性
细胞中原癌基因转变为癌基因的主要途径
点突变
研究发现,ras 基因编码了一个分子量为 2 . 1 ×104 癌蛋白(p21) , 从人类膀胱癌细胞系 T24 DNA 中克隆的 Ha - ras 基因能够诱发 NlH/3T3 细胞转化,而从正常细胞 DNA 中克隆的该原癌基因没有这种功能。
如人类肺癌细胞系 Hs242 的转化基因与 Ha - ras 高度相似,在这个基因中导致转化活性的遗传 损伤是第二个外显子中引起 p21 蛋白第 61 位谷氨酰胺被亮氨酸所替代的一个点突变。所以,p21 分子某些部位发生单个氨基酸替代足以引起蛋白质构象的改变,并使细胞获得转化活性。
LTR 插入
LTR 是逆转录病毒基因组两端的长末端重复序列 , 含有强启动子序列,当LTR 插入原癌基因启动子区域或邻近部位后,可从根本上改变基因的正常调控规律。
基因重排
正常情况下,c - myc 定位于 8q24 , 免疫球蛋白重链基因(IgH) 定位于 14q32 , 轻链 λ基因(Igλ) 定 位于 22q12 , 轻链 k 基因(Igk)定位于 2p11 。
在 Burkitt 淋巴瘤中,c - myc 易位至 IgH 、Igk 或 Igλ的位点,使 Ig 基因与 c - myc 相连在一起,Ig 基 因启动子使原来不表达的 c - myc 高表达。
在正常人体细胞中,非受体型酪氨酸蛋白激酶基因 abl 位于第 9 号染色体上,表达量极低,不会诱发癌变。在慢性骨髓瘤病人细胞中,该基因却被转移到第 22 号染色体上,与 bcr 基因相融合,表达量大为提高,发生癌变
abl 原癌基因通过选择性染色体重排转变成细胞癌基因
缺失
很多原癌基因 5 ’上游区存在负调控序列,一旦该序列发生缺失或突变,就丧失抑制基因表达调控 的能力。如 Burkitt 淋巴瘤中 C - myc 可因负调控序列的缺失或 LTR 插入破坏其结构而增强表达。
基因扩增
使每个细胞中基因拷贝数增加,从而直接增加可用的转录模板。
四、基因互作与癌基因表达
染色体构象对原癌基因表达的影响
基因表达不仅取决于基因本身及其相邻区域的一级结构,也取决于其空间构象,即基因在染色体 上的空间排列和染色质的结构。当两个基因相距太近时,往往不易形成有利于高效转录的空间结构。
基因与基因之间的间隔距离被定义为“基因领域 ”。 同一 DNA 链上两个具有相 同转录方向的基因间隔小于一定长度时,影响有效转录所必需的染色质结构的形成,从而使这两个基因中的一个或两个均不能转录或转录活性显著降低,产生所谓基因领域效应 。
正常人 c - myc 定位于第 8 号染色体,在其两侧分别存在强表达的基因,使 c - myc 处于两面受夹 击的地位。在 Burkitt 淋巴瘤中,由于发生基因重排,使 c - myc 基因一侧的强表达基因消失,从而消除 了对 c - myc 的基因领域效应,使后者的转录活性增强。
小鼠细胞中,c - myc 的 5 ’上游区域也存在一个强表达基因,全长 15kb , 距 c - myc 只有 3kb 。很 显然,这一间隔距离太短,与基因有效转录应有的最小距离相差甚远,c - myc 受基因领域效应的影响非常大,表达受抑制。
在小鼠乳腺癌细胞中,上述间隔距离被显著拉长,激活 c - myc 转录。
原癌基因终产物对基因表达的影响
癌基因产物通过介质传递生长刺激信号的部位有 3 处:
癌基因产物本身模拟了生长因子,因而与相应的受体作用,以自分泌的方式刺激细胞生长;
癌基因产物模拟了已结合配体的生长因子受体,从而在无外源生长因子时提供了促进细胞分裂的信号;
癌基因产物作用于细胞内生长控制途径,解除此途径对外源刺激信号的需求。
人血小板衍生生长因子(PDGF)与猴肉瘤病毒(SSV)的 V - ras 癌基因产物,上皮生长因子(EGF) 与 Src 及 V - erb 癌基因产物之间都存在着极高的相似性,表明生长因子与癌基因转化有关。
抑癌基因产物对原癌基因的调控
因为抑癌基因产物能够抑制细胞的恶性增殖,所以它被认为是一种隐性癌基因。 当细胞内由于某种原因造成这些基因的表达受抑制时,原癌基因就活跃表达,引起细胞癌变。
1990 年,科学家首次发现 p53 是一个肿瘤抑制基因。缺失该基因时,患 Li - Fraumeni Syndrome 。此外,病人极易患乳腺癌,脑癌和白血病。
p53 基因在星形细胞癌、乳癌、肺癌、肠癌及骨肉瘤中都有高频率缺失现象。从癌细胞中得到的 p53 基因,其保守序列区有单一位点的突变,推测可能由于这一突变导致 p53 基因产物结构与功能的改变,失去抑癌活性。
p53 基因与细胞癌变
a. 正常情况下,细胞分裂与 p53 基因无关;
b . 如果细胞中的 DNA 受损伤,p53 基因被激活,使细胞受阻于 G1 阶段直到 DNA 被修复或启动细胞凋亡程序;
c . 如果细胞中 p53 基因的两个拷贝同时被破坏,细胞可能直接死于有丝分裂过程中,也可能带着损伤继续分裂,从而导致发生恶性肿瘤。
外源信号对原癌基因表达的影响
细胞外信号(包括生长因子、激素、神经递质、药物等)作用于靶细胞后,通过细胞膜受体系统或其它直接途径被传递至细胞内,再通过多种蛋白激酶的活化,对转录因子进行修饰,然后激活一 系列基因转录
第二节 人免疫缺损病毒— HIV
HIV
人免疫缺损病毒(HIV) , 俗称艾滋病毒(AIDS) , 诱发人类获得性免疫缺损综合症。该病毒在分类上属反转录病毒科慢病毒属中的灵长类免疫缺损病毒亚属。1983 年,法国巴斯德研究所和美国国家卫生研究院癌症研究所首次证实 HIV 是艾滋病的病因。
HIV Ⅰ是从欧洲和美洲分离的毒株,与猴艾滋病毒只有约 45% 的相似性,它的致病力很强,是引起全球艾滋病流行的主要病源。
HIV Ⅱ与猴艾滋病毒的相似性高达 75% , 其毒力较弱,引起艾滋病的病程较长,症状较轻,且主要局限于西部非洲
反转录病毒科主要成员
有关 HIV 的研究主要是针对 HIV Ⅰ进行的。
一、HIV 病毒粒子的形态结构和传染
艾滋病病毒粒子是一种直径约为 100nm 的球状病毒,包被着由两层脂质组成的脂膜,这种结合有许多糖蛋白分子(主要是 gp41 和 gp120) 的脂质源于寄主细胞的外膜。蛋白质 p24 和 p18 组成其核 心,内有基因组 RNA 链,链上附着有反转录酶,其功能是催化病毒 RNA 的反转录
HIV I 病毒粒子结构模式图。其中 gp120 和 gp41 为外膜蛋白,MA 为内膜蛋白,CA 为外 壳蛋白,NC 为核衣壳蛋白,RT 为反转录酶。
HIV 依靠血、血制品以及人体分泌的奶液和精液等传播主要感染 T 淋巴细胞,也感染 B 淋巴细胞和单形核细胞等。
HIV 感染形成多核巨细胞,并导致细胞死亡。HIV 病毒可以通过所感染细胞扩散到全身,已在淋巴细胞、脑、胸腺、脾等组织发现了该病毒。
自然界广泛存在着突变株。
二、HIV 基因组及其编码的蛋白
HIV 基因组结构
HIV 基因组由两条单链正链 RNA 组成,每个 RNA 基因组约为 9 . 7kb . 在 RNA5 ’端有一帽子结构( m7G5 ’GmpNp)3 ’端有多聚(A)尾巴。
主要由 5 ’末端 LTR、结构蛋白编码区(gag) 、蛋白酶编码区(pro) 、具有多种酶活性的蛋白编码区(pol) 、外膜蛋白( env )和 3 ’未端 LTR 组成。
HIV I 基因编码区有很多重叠,尤其在基因组的 3 ’端。HIV 基因组中的部分基因如 Tat 和 Rev 是不连续的,被插入的内含子分隔成两个外显子。
HIV I 至少有 4 个功能性的剪接供体位点和 6 个受体位点。
HIV 编码的蛋白质及其主要功能
HIV 的结构蛋白主要包括 3 个基因。gag 基因编码病毒的核心蛋白,翻译时先形成 一个前体 (p55) , 然后在 HIV 蛋白酶的作用下被切割成 p17 、p24 、p15 三个蛋白。P24 和 p17 分别组成 HIV 颗粒的外壳(CA)和内膜蛋白(MA) , p15 进一步被切割成与病毒 RNA 结合的核衣壳蛋白(NC)p9 和 p7 。
Pol 基因编码病毒复制所需的酶类包括逆转录酶 p66 、整合酶 p32 。
从 pol 和 gag 基因重叠区内起始的一段序列为 pro 基因,它编码蛋白酶 p22 , 在切割 HIV 蛋白前体的过程中起作用。
env 编码 8 . 8 ×104 的蛋白质,经糖基化后其相对分子质量增至 1 . 6 ×105 , 是 HIV 包膜糖蛋白 Gp160 的前体,可进一步被切割成 Gp120 和 Gp41 。
Gp120 是外膜蛋白,感染细胞时可与细胞的 CD4 受体蛋白相结合,并与 G 蛋白偶联受体(GPCR)家族中的一个跨膜蛋白发生相互作用。
Gp41 是跨膜蛋白(TM) , 嵌入病毒包膜脂质中,对 HIV 的侵染和致病有非常重要的作用。
HIV 膜蛋白主要功能区
主要抗原决定簇:
包括 V3 区的主抗原决定簇及若干个较弱的决定簇,其中有两个分别位于 Gp41 的 616 - 632 位和 724 - 751 位。
T 细胞决定簇
两个辅助性 T 细胞决定簇 T2 和 T1 分别 C1 区和 C4 区,一个主要细胞毒 T 细 胞决定簇位于第 308 - 322 位。另有 3 个较弱的细胞毒 T 细胞决定簇在 Gp41 上
CD4 受体结合区:
该区位于 C4 区。在上述功能区以外的某些氨基酸突变也能影响 gp120 的 功能,说明上述各功能区发挥作用还依赖于整个分子特定的空间构象。
三、HIV 的复制
HIV 与受体结合后,病毒核心蛋白和两条 RNA 链进入细胞。反转录酶以病毒 RNA 为 模板合成单链 DNA , 并由宿主细胞 DNA 聚合酶合成双链 DNA(原病毒),经环化后进入细胞核并整合到染色体上,随细胞的分裂传代,可长期潜伏
复制主要过程如下:
①原病毒整合到宿主染色体上,无症状;
②原病毒利用宿主细胞的转录和合成系统转录产生病毒 mRNA , 其中一部分编码病毒蛋白,与基因组 RNA 组装成新的病毒颗粒,从寄主细胞中释放出来侵染其它健康细胞;
③寄主细胞瓦解死亡。
四、HIV 基因表达调控
与大多数反转录病毒相比,HIV 的最大特点就是含有许多调控基因。
LTR 序列
LTR 序列位于 HIV 基因组两端,其序列是高度保守的,在 HIV - I 与 HIV - II 及 SIV 之间的保守 性高达 95% 以上,为核心调控元件、核心转录单位和反式激活因子应答元件
参与 HIV 复制的调控蛋白
Tat 蛋白
Tat 与 YAR 对 HIV 复制的协同调控作用
Rev 蛋白
Nef 蛋白
Vpr 蛋白
Vpu 蛋白
Vif 蛋白
五、HIV 的感染及致病机理
HIV 感染人体后立即大量复制和扩散,血清中出现 HIV 抗原,从外周血细胞、脑脊液和骨髓细胞中均能分离出 HIV , 是 HIV 原发感染的急性期。
大约 70% 以上的原发感染者在感染后 2 - 4 周内出现急性感染症状,包括发热、咽炎、淋巴结肿大、关节痛、中枢及外周神经系统病变、皮肤斑丘疹、粘膜溃疡等,持续 1 - 2 周后进入 HIV 感染的无症状潜伏期。
感染无症状潜伏期(可长达数年)。此时无任何临床症状,外周血中 HIV 抗原含量很低甚至检测 不到。随感染时间的延长,HIV 重新开始大量复制并造成免疫系统损伤。临床上病人感染逐步发展到持续性全身性淋巴腺病(PGL) 、艾滋病相关综合症(APC)等,直至发展到艾滋病。
HIV 除在细胞内大量繁殖造成细胞死亡外,还可通过以下几种途径导致免疫功能下降:
①HIV 粒子表面的 gp120 蛋白脱落,与正常细胞膜上 CD4 受体结合,使该细胞被免疫系统误认为病毒感染细胞而遭杀灭;
②因 T 细胞 CD4 受体被 gp120 封闭,影响了其免疫辅助功能;
③HIV 的 gp120 蛋白可刺激机体产生抗 CD4 结合部位的特异性抗体,阻断 T 细胞功能;
④带有病毒包膜蛋白的细胞可与其他细胞融合形成多核巨细胞而丧失功能。
六、艾滋病的治疗及预防
迄今为止仍无任何药物可以完全抑制 HIV 在感染者体内的增殖并彻底治愈艾滋病。
核苷酸型和非核苷酸型反转录酶抑制 HIV 的作用机制。
a. 核苷酸型反转录酶抑制剂。 由于它在结构上与脱氧核苷酸的相似性,掺入后使病毒 DNA 的合成不能进行。
b . 非核苷酸型反 转 录 酶 抑 制 剂 。 与 反 转 录 酶 相 结 合,通 过 限 制 该 酶 的 移 动 性 而 影 响 它 的活性 。
第三节 乙型肝炎病毒— HBV
HBV
病毒性肝炎是严重威胁人类健康的世界性传染病,引起肝炎的病毒通称肝炎病毒 。 目前已经知道的至少有甲肝病毒(HAV) 、乙肝病毒(HBV) 、丙肝病毒(HCV) 、丁肝病毒(HDV)和戊肝病毒(HEV)等 5 种病毒。
甲肝病毒属小 RNA 病毒科
乙肝病毒属嗜肝病毒科,为 DNA 病毒
丙肝病毒与黄热病毒和瘟病毒相似,为 RNA 病毒
丁肝病毒基因组由单链环状 RNA 分子组成,其外壳能识别乙肝病毒的表面抗原,是一种与乙肝有关的缺陷型病毒,需要有 HBV 的辅助才能复制增殖。
戊肝病毒基因组为单链正链有多聚(A)RNA , 球形无包膜。
一、肝炎病毒的分类及病毒粒子结构
HBV 完整粒子的直径为 42nm , 由外膜和核壳组成,有很强的传染性。
其外膜由病毒的表面抗原、多糖和脂质构成;核壳直径 27 nm , 由病毒的核心抗原组成,并含有病 毒的基因组 DNA、反转录酶和 DNA 结合蛋白等乙肝病毒的基因组是一个有部分单链区的环状双链DNA 分子,两条单链长度不同。
长链 L 为负链,而短链 S 为正链。基因组依靠正链 5 ’端约 240bp 的粘性末端与负链缺口部位的 互补维持了环状结构。
二、乙肝病毒基因组及其所编码的主要蛋白
S 编码区
S 编码区编码乙肝表面抗原蛋白,分别编码表面抗原主蛋白(SHBS) 、原 S1 蛋白和原 S2 蛋白 3 部分。S 蛋白和原 S2 蛋白组合在一起被称为中蛋白( MHBS) , S 蛋白和原 S1 、原 S2 蛋白组合在一起时被称为大蛋白(LHBS) 。
SHBS 是病毒外壳蛋白和颗粒表面抗原的主要成分,占病毒蛋白的 70% - 90% , 中蛋白和大蛋白 则暴露于病毒颗粒表面。表面抗原有很强的免疫原性,是乙肝疫苗的主要成分。
P 编码区
约占全基因组 3/4 以上,是最长的编码区,包含全部 S 编码区并与 C 和 X 编码区有部分重叠。
P 编码区由 3 个功能区和一个间隔区构成,分别为末端蛋白( 又称引物酶)、间隔区、反转录酶/ DNA 聚合酶及 RNaseH 。末端蛋白是病毒进行反转录时的引物。P 编码区可能先翻译成 9 . 5 ×105 多肽,然后加工成较小的功能型多肽。
C 编码区
该区长 639 碱基,翻译产物为病毒核心抗原(HBcAg) 。其原初翻译产物是前核心蛋白,切除 N 端 19 肽和富含精氨酸的 C 末端后,成为 E 抗原(HBeAg) , 分子量为 2 . 2 ×104 蛋白,是核衣壳上唯一 的结构蛋白。HBeAg 是分泌型蛋白,可在血清中检测到。
X 编码区
是最小的编码区,编码 X 蛋白,覆盖了负链的缺口部位,虽然长度不等,但主要产物由 154 个氨基 酸残基组成。X 蛋白具有反式调控作用,能激活多个同源或异源启动子或增强子,与肝癌的发生有相 关性。
三、HBV 的复制
乙肝病毒基因组为双链 DNA , 但其复制并不通过半保留复制方式,而是通过反转录途径
HBV 基因组复制模图
第四节 人禽流感的分子生物学机制
人禽流感(HAI)是人感染 AIV 后引起的以呼吸道症状为主的临床综合症。引起 HAI 的病原为禽流感病毒,属正黏病毒科流感病毒 A 型流感病毒。
一、人禽流感病毒特点及分型
禽流感属正黏病毒科流感病毒属的 A 型流感病毒。正黏病毒分为三个属:AB 型流感病毒属、C型流感病毒属、类托高土病毒属。
病毒颗粒约为 80 ~ 120nm , 典型的病毒粒子呈球状,基因组为多个负链 RNA 片段组成
一般按病毒粒子表面的两种糖蛋白血凝素( HA) 及神经氨酸酶( NA) 的结构和抗原性的不同,将禽流感病毒分为 16 个 H 亚型和 9N 型,H 和 N 的不同组合形成上百个血清亚型。
导致禽流感爆发的主要是:
以 H5 、H7 为代表的高致病性禽流感(HPAI)
以 H9 亚型为代表的低致病性禽流感(LPAI)
二、禽流感病毒进入细胞及转录与复制
H5N1 禽流感病毒通过 HA 蛋白上的凝集素位点与细胞表面含唾液酸的糖蛋白受体结合,通过受体介导的细胞内吞作用进入细胞。
三、禽流感病毒感染人类的机制
禽流感导致人类流感有两种假说:
猪作为中间宿主的混合器假说
禽流感病毒直接感染人(即人本身充当混合器)禽流感病毒跨越种属间的屏障从家禽直接感染人与其基因组的分子结构有关。
该病毒基因组分为多个片段,极易发生基因交换、重组和变异,导致感染宿主和致病性改变。
第五节 严重性呼吸系统综合征 - SARS 的分子机制
一、SARS - C oV 的结构与分类
严重急性呼吸系统综合征( SARS) 已经证明是由 SARS 冠状病毒引起( SARS - C oV) 。SARS - C oV 属冠状病毒科、冠状病毒属。病毒直接在 80 ~ 160nm , 有囊膜,表面镶嵌有 12 ~ 24nm 的球形梨状 或花瓣状纤突,由于囊膜上的纤突呈规则状排列成皇冠状,故称之为冠状病毒
二、SARS - C oV 的基因组结构
基因组为单链正链 RNA , 全长 27 ~ 30kb , 是目前已知最大的 RNA 病毒。具有正链 RNA 特有的重 要特征:5 ’端有甲基化帽子,其 3 ’端有不少于 50 个碱基的 polyA 。全基因组共有 14 个开放读码框。冠状病毒的 RNA 和 RNA 之间重组率非常高,病毒出现变化正是由于这种高重组率。
三、SARS - C oV 的侵染过程
SARS - C oV 生活周期包括:病毒侵染、病毒复制、病毒组装和病毒分泌。
病毒先通过病毒囊膜上的 S 蛋白与细胞的受体结合,通过其编码蛋白的自身折叠与相互结合牵引将病毒囊膜和细胞膜拉近而发生融合,使病毒遗传物质以内吞的方式进入靶细胞。
随后以病毒基因组为模板合成负链 RNA , 再以后者为模板转录生成新的病毒基因组 RNA 。
四、SARS - C oV 的起源及变异
目前,SARS - C oV 的起源仍不明了。但是,我国广东的一项调查显示,70% 的果子狸携带 SARS - C oV , 而 40% 的野生动物经销商体内都含有 SARS - C oV 的抗体,其中单营果子狸者 SARS 冠状病毒感 染率为 58% , 明显高于单营蛇类者,暗示果子狸可能是 SARS 病毒的重要载体。
研究表明,动物的 SARS 样病毒是人类 SARS SARS - C oV 的前体。但人 SARS - C oV 的最终源头 问题有待于进一步研究
第六节 基因治疗
人类疾病的发生,其实都是人体细胞中自身基因的改变或由外源病原体的基因产物与人体基因 相互作用的结果。
1990 年,科学家第一次用反转录病毒为载体把腺苷脱氨酶基因(ADA) 导入来自病人自身的 T 淋 巴细胞,经扩增后输回患者体内,获得了成功。5 年后,患者体内 10% 的造血细胞呈 ADA 基因阳性
一、基因治疗的主要途径
基因治疗的两大途径:ex vivo 与 in vivo 方式。
ex vivo 途径
将含外源基因的载体在体外导入人体自身或异体(异种)被“基因工程化的 ”细胞,经体外细胞扩增后输回人体。
这种方法易于操作,而且因为细胞扩增过程中对外源添加物质的大量稀释,不容易产生副作用。同时,治疗中用的是人体细胞,尤其是自体细胞,安全性好。
in vivo 途径
将外源基因装配于特定的真核细胞表达载体上,直接导入人体内。这种载体可以是病毒型或非病毒型,甚至是裸 DNA , 有利于大规模工业化生产。
这种方式导入的治疗基因以及其载体必须证明其安全性,而且导入体内之后必须能进入靶细胞,有效地表达并达到治疗目的。
二、基因治疗中的病毒载体
用于基因治疗的病毒载体应具备以下基本条件:
携带外源基因并能装配成病毒颗粒;
介导外源基因的转移和表达;
对机体没有致病力。
病毒载体的产生
将适当长度的外源 DNA 插入病毒基因组的非必需区,包装成重组病毒颗粒。
将 4 . 5kb 的 lacZ 基因表达盒插入 HSV - 1 病毒的 UL44(编码糖蛋白 C) 基因的 Xba I 位点中,构 建成重组 HSV 病毒。 由于 UL44 基因产物对于 HSV 病毒在培养细胞中产毒性感染是非必需的,该重组病毒可以在细胞中增殖传代。
病毒载体的分类
重组型病毒载体
在不改变病毒复制和包装所需的顺式作用元件的情况下,有选择性地删除病毒的某些必需基因 尤其是前早期或早期基因以控制其表达,所缺失的必需基因的功能由同时导入细胞中的外源基因表 达单位提供。一般通过同源重组方法将目的基因插入到病毒基因组中。
无病毒基因的病毒载体
在辅助系统的作用下,重组载体以特定形式(单链或双链 DNA 或 RNA) 被包装到不含有任何病 毒基因的病毒颗粒中。这类载体的优点在于载体病毒本身安全性好,容量大。缺点在于往往需要辅 助病毒参与载体 DNA 的包装,造成终产品中辅助病毒污染。
基因治疗中的问题
靶向性基因导入系统。基因治疗中的关键问题是必须将治疗基因送入特定的靶细胞,并在该 细胞中得到高效表达。这对于恶性肿瘤治疗尤为重要,如果不能有效地将治疗基因导入大多数肿瘤细胞,则至少要求它尽可能不进入或较少进入正常细胞。
外源基因表达的可控性。最理想的可控性是模拟人体内基因本身的调控形式,需要全基因或 包括上下游的调控区及内含子序列,将对导入基因的载体系统产生严峻的挑战,因为今后设计的载体须有几十 kb 甚至上百 kb 的包装能力。
治疗基因过少。 目前用于临床试验的治疗基因数量很少。绝大部分多基因疾病,如恶性肿瘤、高血压、糖尿病、冠心病、神经退行性疾病的致病基因还有待阐明,因此,可选择的靶基因不多。
三、基因治疗中的非病毒载体
病毒载体存在许多不同,主要体现在免疫原性高、毒性大、目的基因容量小、靶向特异型差、制备较复杂及费用较高等。
所以,人们越来越重视人工合成的非病毒载体的研究。
目前,常用的非病毒载体包括裸 DNA、脂质体载体及阳离子多聚物型载体等
第十章 基因与发育
第一节 免疫体系发育及免疫球蛋白基因表达
免疫体系
免疫系统是动物的主要防御系统,包括淋巴细胞( 分 B - 淋巴细胞和 T - 淋巴细胞)及组织相容性抗原两部分。巨噬细胞也参与免疫反应。
免疫系统的细胞通过一个被称为 “分子识别 ”的过程鉴别 “外来物质 ”。一旦检测到有外来物质存在,它们就用产生特异性抗体或类似方法将其消灭。
黄色部分是呈递于 T - 淋巴细胞表面的 T - 细胞受体;
蓝色部分是展示在受感染细胞表面的 MHC 蛋白;
白色部分是来自某个感染人体的逆转录病毒的特征
T 淋巴细胞产生于胸腺 , 它的主要功能是产生 T 淋巴细胞受体,识别产生抗体的 B 淋巴细胞,以帮助巨噬细胞发挥功能。
组织相容性抗原 , 保证机体识别自身细胞和异源细胞,参与淋巴细胞及其他许多细胞间的反应。
B 淋巴细胞由骨髓产生,主要功能是制造用于对付外来抗原的抗体,它专一地识别相应的抗原。
抗体、T 淋巴细胞受体和组织相容性抗原是免疫系统中 3 种最重要的成份。这 3 类蛋白的共同特点:多样性。每类蛋白质都由一个巨大的基因家族编码,有许多变异型。在抗体和 T 淋巴细胞受体中,基因片段重排导致了所编码蛋白质的多样性。
一、脊椎动物免疫系统
脊椎动物免疫系统产生的抗体能识别和结合数百万种潜在的 “非本身 ”的抗原分子 , 说明免疫细胞要合成数量巨大的抗体分子。
Ig(抗体)分子通过特定的结合位点形成抗原 -抗体复合物,最终被巨噬细胞所吞噬。Ig 最高可占血液总蛋白的 20% 。
在细胞免疫体系中,受体细胞产生出类似 Ig、但紧密结合在细胞膜表面的蛋白质分子,与 T 淋巴细胞表面的受体专一结合,导致感染细胞被后者降解。
图示生物体内存在的两条主要免疫途径
①液免疫
②胞水平免疫
两类获得性免疫反应都由在血液和淋巴组织之间循环的淋巴细胞所介导。
体液免疫由 B 淋巴(细胞)介导;细胞免疫体系由 T 淋巴(T 细胞)介导。
哺乳动物 B 细胞产生于骨髓中。成熟 B 细胞主要存在于淋巴结皮质浅层的淋巴小结及脾脏的红 髓与白髓淋巴小结内,在抗原刺激下可分化为浆细胞,合成和分泌免疫球蛋白来识别相应的外来抗原,执行机体的体液免疫功能。
B 细胞和 T 细胞的发育过程
二、B 淋巴细胞及其发育和分化
B 细胞的分化
哺乳类动物 B 细胞的分化过程可分为以下几个阶段:祖 B 细胞、前 B 细胞、未成熟 B 细胞、和成 熟 B 细胞等。其中祖 B 细胞、前 B 细胞、未成熟 B 细胞的分化不依赖于抗原,其分化过程在骨髓中完成。
祖 B 细胞由骨髓淋巴细胞分化而来,仅存在于骨髓、胎肝等组织中。在早期祖 B 细 胞中,D - J 基因片段开始重排,并开始表达 B 细胞受体( BCR) 复合物中的 Igα和 Igβ。 在晚期祖 B 细胞中 V - DJ 发生重排。
根据前 B 细胞的形态以及轻链基因的重排,可将其分为大前 B 细胞和小前 B 细胞。
大前 B 细胞 VDJ 重排后表达 μ链,并表达前 B 细胞受体。小前 B 细胞轻链只发生 V - J 发生重排,无功能性 Ig 表达,缺乏对抗原的反应能力。
B 细胞膜表面分子标记
膜表面球蛋白是 B 细胞的重要标志,是 B 细胞特异性识别抗原的受体。未成熟 B 细胞表达 IgM , 成熟 B 细胞同时表达 IgM 、D 、G、A 和 E 。B 细胞表面 Ig 的可变区都由 VH 和 VL 基因编码。记忆 B细胞表面不存在 IgD , 抗原刺激后 B 细胞表面 IgD 也消失。
三、T 淋巴细胞及其发育和分化
T 淋巴细胞 , 来源于骨髓淋巴样干细胞,其主要功能是产生 T 淋巴细胞受体。T 细胞不仅直接执行细胞免疫功能,而且还可以通过产生多种细胞因子或表达黏附分子等手段,与其他免疫细胞发生直接或间接的相互作用,从而发挥广泛的免疫调节功能
T 细胞的分化与发育
研究小鼠胸腺细胞的发育过程表明,在胚胎发育到 11 - 12 天时,淋巴干细胞进入胸腺,并在胸腺微环境的影响下迅速发生增殖和分化
诱导 T 淋巴细胞在胸腺内分化、成熟的主要因素有:
胸腺基质细胞分泌多种细胞因子及胸腺激素,通过其细胞表面的黏附分子直接与胸腺细胞发生相互作用,诱导后者分化;
胸腺中的“抚育细胞 ”参与调控 T 细胞的成熟和分化
胸腺细胞自身可分泌多种细胞因子,影响本身的分化和成熟;
巨噬细胞、胸腺内上皮细胞和树突状细胞也参与胸腺细胞分化过程。
N otch 信号与 T 细胞分化
在免疫系统发育过程中,Notch 信号途径使淋巴干细胞向 T 细胞前体分化,促进了 TCR αβ型 T细胞的形成。表达功能性 TCRαβ。
T 细胞表面受体
T 细胞受体(TCR)是 T 淋巴细胞表面识别自身 MHC - 抗原肽复合物的受体,含有 α、β、γ和 δ四种多肽,属于免疫球蛋白基因超家族的成员。它与 CD3 在细胞表面组成 TCR - CD3 复 合物,并传递抗原刺激信号。
四、免疫球蛋白的结构
抗体的基本结构是一个四聚体的免疫球蛋白分子,由 4 条(两对)多肽链组成,包括两条相同的轻链和两条相同的重链 。轻链约 2 . 3 ×104 , 重链则介于 5 . 3 ×104 ~ 7 . 0 ×104
Ig 分子结构示意图
VH , 重链可变区;CH1 , CH2 , CH3 , 重链不变区;
VL , 轻链可变区;CL , 轻链不变区
根据抗体的重链结构特征将其分为 5 类, 再根据抗原的不同和结构的变化又可分出若干亚类。每种类型都有一个特征性的恒定区。
五、免疫球蛋白的基因结构
免疫球蛋白分子由 Igk 、Igl 和 Igh 基因编码,位于不同的染色体上。
1965 年,Dreyer 和 Bennet 认为,Ig 的 V 区和 C 区由分隔存在的基因所编码,这些基因片段在淋巴细胞分化和发育过程中发生易位重排,形成有转录活性的免疫球蛋白基因。
Hozumi 和 Tonegawa 在 1976 年应用 DNA 重组技术证实了这一假说。Tonegawa 因在免疫球蛋白基因结构研究上的重大突破获 1987 年诺贝尔生理医学奖。
免疫球蛋白轻链基因结构
κ基因
位于人类第 2 号染色体上,其可变区和恒定区分别由不连续的 V 基因和 C 基因编码。V 与 J 基因以多拷贝形式存在,其中 V 基因簇含有约 300 个拷贝。
人类和小鼠的 J 基因簇都包含 5 个 J 基因,位于 V 基因簇的 3 ’端,与最后一个 V 基因的 3 ’端相 距 23kb , 与 κ链恒定区 C 基因的 5 ’端相距约 2 . 5kb 。
人和小鼠的 C 基因都是单拷贝,它编码了 κ链 C 区的 106 个氨基酸序列( 第 109 - 214 位氨基酸)。
λ基因。小鼠有两个 Vλ基因:
Vλ1 和 Vλ2
人类 Vλ基因有 30 个拷贝,可分为 Vλ1 - 10 十个亚群,Vλ1 - 5 是主要亚群,比较保守。
小鼠 Cλ基因簇有 4 个拷贝,而人类 Cλ基因有 6 个以上的拷贝。基因表达过程中,每个 Vλ基因都和 Cλ基因成对排列
人类 Ig 基因结构示意图
免疫球蛋白重链基因结构
人重链基因位于 14 号染色体,由 V 、D 、J 和 C 四种不同基因片段组成。 编码重链 V 区基因长约 1000 - 2000kb , 包括 V 、D 、J 三组基因片段。每个 V 基因片段上游有 L 基因片段,编码 20 - 30 个疏水性氨基酸的信号肽。
六、Ig 基因重排与 DNA 的多样性
一个生物为什么能产生百万种(106 ~ 108)以上的 Ig 分子呢?
其根本原因是 V 区和 C 区不同片段在 DNA 分子水平上发生了被称为种系重组的重排。单一种系状态的 Ig 基因是不能表达的,只有经过重排才有可能得到表达。
轻链基因的重排与连接
V 和 J 重排是通过 V 基因 3 ’端和 J 基因 5 ’端之间的侧翼序列(又称识别序列)实现的。它具有 一段由 7 个碱基组成的反向回文序列— CACAGTG , 在 V 3 ’端紧接着回文序列的是 11 个碱基的间隔序列,而后是 9 个富含 A、C 的碱基。
J5 ’端也包含有与上述 7 碱基及 9 碱基区相配对的序列,其间隔序列由 23 个碱基组成,不能与 V3 ’端 11 个碱基配对,因而形成单链突起(茎环结构)。V 、J 结合后,上述茎环结构被切除,形成连续的 V 、J 片段。
Vκ与 Jκ基因的重排是通过 Vκ基因 3 ’和 Jκ基因 5 ’端的识别序列完成的
V 基因簇中的任何一个 V 片段和 J 基因簇中的任何一个 J 片段在 DNA 水平上均可随机结合形成VJ 单位。这种随机组合重排并不很不精确,造成了重排后的多样性。
V3 ’和 J5 ’常由于重排不精确而造成碱基丢失或错位,导致 κ链中第 96 位以后的氨基酸编码发生改变,免疫球蛋白结构发生多样性变化。
交互使用 V 和 J 基因间的重组位点,可以产生新的密码子,形成 4 个不同的重组框架,并在第 96 位密码子上产生 3 种不同的氨基酸,其中 Arg 密码子在种系基因组中是没有的,这是连接反应造成免疫球蛋白多样性的机制之一。
重链基因的重排与连接
重链基因虽然只有一个位点,但结构十分复杂。如小鼠重链基因就包含了大约上百个 VH 片段、 10 多个 D 片段和 4 个 J 片段以及下游 17kb 处的 CH 片段。V 基因和 D 及 J 片段组合能产生 4000 个不同的 V 区,每个 V 区都能和 CH 基因相组合。
人类的 CH 基因簇含有 10 个基因,小鼠 CH 基因簇只有 8 个基因。这些 CH 基因虽然都有表达活性,但在同一细胞中只有一个基因表达。
七、免疫球蛋白基因表达
一个 B - 淋巴细胞中发生 V - J 和 V - D - J 重排时,只有一种重组类型出现,产生一种轻链和一 种重链。淋巴细胞中产生免疫球蛋白的基因位于两条同源染色体上,这种因为一条染色体上基因的表达而抑制另一条染色体上相同基因表达的现象称为等位基因排斥 。
同型排斥 B - 淋巴细胞的轻链表达时,只生成一种链( κ链或是 λ链),不 可能同时表达 κ链和 λ链 。等位排斥和同型排斥保证了 B 淋巴细胞无性系只表达 一 种特异性抗体 。
科学上将未发生重排的种系构型等位基因称为 Ig °,发生重排并进行功能表达的等位基因称为 Ig + , 发生无效重排的无活性等位基因称为 Ig -
八、主要组织相容复合体的表达
主要组织相容性复合体概述
引起移植排斥的细胞表面抗原称为组织相容性复合体 (MHC) ,在移植排斥中起决定作用,是机体特异性免疫反应中心
细胞毒性 T 细胞能识别所有与 I 型 MHC 分子相结合的受感染细胞携带的外源蛋白片段,辅助 T细胞只能识别抗原呈递细胞(如巨噬细胞和 B 细胞)表面所携带的外源蛋白。T 细胞表面受体(TCR)
细胞毒 T 细胞通过表面 TCR 识别呈递于 MHC 分子表面的异己外源肽段,并直接杀伤呈递这类MHC 的细胞
辅助 T 细胞通过 TCR 识别Ⅱ 型呈递的外源肽段。MHC MHC 与 TCR、Ig 相互配合,构成了生物体内复杂多变的免疫反应和应答。
MHC 的分类
人 MHC 又称白细胞抗原(HLA) 体系,是到目前为止免疫体系中最复杂,最具多态性的体系。
HLA 基因簇位于第 6 号染色体,全长 3 . 0 ×106bp , 共分为 4 型:
第二节 果蝇的胚胎发育
第三节 高等植物花发育的基因调控
植物花的发育可分为三个阶段,即营养分生组织阶段,花序分生组织发生阶段和花分生组织发生阶段。
人们已从模式植物如拟南芥 或金鱼草中分离克隆到许多控制植物开花的基因
一、植物的花器官结构
植物的花由枝条变态产生,而花器官由叶片变态产生。种子植物的成年花器官由花萼、花瓣、雄蕊、雌蕊( 心皮)等四轮结构所组成。
营养分生组织产生花序分生组织,花序分生组织产生花分生组织。早期花分生组织类似于营养分生组织,具有无限生长特性
拟南芥花的构成
二、调控花器官发育的主要基因
花分生组织决定基因促进从花序分生组织产生花分生组织并进一步分化产生花器官原基,但产生何种花器官则由同源域基因所控制。
同源域基因与花器官发育
金鱼草、拟南芥等植物的花都由四种类型的花器官组成,花器官排列成向心的圆环形,称作轮性。野生型金鱼草和拟南芥的花由四个花萼组成最外的第一轮、依次向内为四个花瓣组成第二轮,六个雄蕊组成第三轮,两个融合的心皮组成第四轮。
花器官的同源异型突变包含四大类型:
类型Ⅰ 为第一轮和第二轮器官受影响,产生心皮状的花萼和雄蕊状的花瓣。
类型Ⅱ为第二轮和第三轮器官受影响,产生花萼状的花瓣和心皮状的雄蕊。
类型Ⅲ 为第三轮和第四轮器官受影响,产生花瓣状的雄蕊和花萼状的心皮,而且最内两轮器官的数量和轮数也发生了改变。
类型Ⅳ 中四轮结构全部受影响。
研究发现,每种类型突变体都是因为发生了同源域基因的突变而使相邻两轮花器官受到影响。已经克隆了多个涉及花发育的同源域基因 。 由于这些基因家族( MCM1 、AG 、DEFA 和 SRF)成员均含有一个保守的区域,根据这几个家族基因名称的第一个字母,将该保守区命名为 MADS - BOX 。
已经克隆的植物花器官特征决定基因及其可能的功能分析
三、花器官发育的“ABC ”模型
在对拟南芥和金鱼草突变体及花器官特征决定基因功能的研究中,E . Myerowitz 提出了控 制花形态发生的 “ABC ”模型 。根据这个模型,正常花的四轮结构的形成是由三组基因共同作用而完成的 。
每一轮花器官特征的决定分别依赖于 A、B 、C 三组基因中的一组或两组基因的正常表达。如其中任何一组或更多的基因发生突变而丧失功能,则花的形态将发生异常。
A 基因在第一、二轮花器官中表达,
B 基因在第二、三轮花器官中表达,
C 基因在第三、四轮花器官中表达
由三组同源异型基因决定四轮花器官特征的“ABC ”模型
A 基因本身决定萼片,A 和 B 基因共同决定花瓣,B 与 C 基因共同决定雌蕊,C 基因决定心皮。
A 基因突变后(如 ap1 、ap2) , 第一轮花器官中的花萼突变为心皮,第二轮花器官中的花瓣突变为雄蕊。B 基因突变后(如 ap3 、pi 突变体),花萼替代了第二轮花器官中的花瓣,第三轮花器官中的雄蕊变为心皮。
若 C 基因失活(如 ag 突变体),则第三轮花器官中的雄蕊和第四轮花器官中的心皮都转变为花瓣。
B 基因在第四轮花器官中的表达受 superman 基因的抑制。sup 突变体第四轮心皮数大大减少,而雌蕊数显著增加。
四、参与诱导开花信号产生、传递和感受的基因
已克隆了两个涉及开花时间的基因,CONSTAINS (CO) 和 LUMINIDEPENDENS (LD) , 两个基因 都在营养生长期表达。CO 可能是一个转录因子,一般情况下促进长日照生长的植物开花。
CO 表达诱导拟南芥提前开花
A:野生型拟南芥;
B:35S 启动子驱动 CO 基因表达诱导拟南芥提前开花。
从短日照延缓开花的豌豆中克隆了一个编码钙离子通道蛋白的 PPF1 基因。转化拟南芥发现,过 量表达 PPF1 基因,明显延缓了转基因植物的开花进程。若用反义 RNA 技术抑制内源 PPF1 基因表达,转基因拟南芥的开花时间就被提前,表明钙信号在植物开花过程中也可能发挥重要作用。
PPF1 基因参与调控植物开花的时间进程。短日照条件下,对照组野生型拟南芥一般在长出 12 - 13 个叶片后(约发芽后 45 天)开花。PPF1 过量表达的转基因拟南芥开花明显 推迟,营养生长旺盛,到发芽后 75 天,长出 24 - 25 片营养叶才开花。反义表达 PPF1 基因的拟南芥则 不到 30 天,长出 6 - 7 片叶就开花。
最终促进开花信号来源于花器官分生组织决定基因 LEAFY ( LFY) 。拟南芥 LFY 突变体比 野生型产生更多的花序分枝,其花呈绿色,由类似花萼和心皮样的器官构成,异位表达 LFY 导致 转基因植物提前开花并将茎尖转变成花,证明 LFY 基因不仅决定花分生组织的特性,而且影响开花时间 。
花 分 生 组 织 决 定 基 因 LEAFY (LFY)将具有无限生长特征的拟南芥茎尖组织转变成花。
A:在 lfy 突变体中正常情况下发育成花的枝 转变成无限枝条。图中所示的所有次生枝条生长
B:过量表达 LFY 的转基因拟南芥中,次生枝转化成花,初级枝在早期发育成终端花或形成一簇花。
TERMINAI FLOWER1(TFLI)是影响拟南芥分生组织特性的另一个非常重要的基因。tf1 突变体 开花提前,初级花序分枝转变成末端花,缺少侧枝,花的数量也大大减少。tf1 突变体( 由无限枝转变 成有限的枝)和 lfy 突变体(由有限的枝转变成无限的枝)的表型恰好相反,说明两个基因可能是相互拮抗的
TFL1 对花发育的调控
花分生组织决定基因在营养生长和成花枝顶端的表达模式分析。 LP:叶原基;SAM:顶端分生组织;FP:花原基
LFY、AP1 和 AP2 基因具有不同的功能。序列分析表明,AP1 、AP2 类转录因子含有 MADS 盒,LFY编码的蛋白质富含脯氨酸和酸性区,它可能代表着一类新的转录因子。
拟南芥各条开花通路之间的相互关系,许多科学家正在共同努力,争取尽快全面揭示植物开花的调控规律,进一步造福人类
第十一章 基因组与比较基因组学
第一节 高通量 DNA 序列分析技术
一、DNA 序列测定的基本原理
无论是对于重组质粒、单个基因还是整个基因组,分析 DNA 结构的最基本方法就是测定出这些 DNA 分子的一级结构— DNA 序列。DNA 自动测序仪可快速测定 DNA 序列,计算机处理能力的快速提高则使得大量 DNA 小片段很容易拼接成较大的片段甚至整个染色体。
高效快捷的 DNA 测序方法是 20 世纪 70 年代中期发展起来的,主要有两种:Sanger 的双脱氧链终 止法和 Maxam - Gilbert 的化学修饰法。后者因更适应序列分析的自动化而逐渐占据优势。
二、基因组 DNA 大片段文库的构建
酵母人工染色体技术YAC为创制基因组物理图提供了极大的方便。
YAC 是迄今容量最大的克隆体,插入片段平均长度为 200 ~ 1000kb , 最大的可以达到 2Mb 。YAC含有三种必须成分:着丝粒、端粒和复制起点。
用细菌的 F 质粒及其调控基因构建细菌染色体克隆载体,称为 BAC, 其克隆能力在 125 ~ 150 kb 左右。主要包括 oriS , repE(控制 F 质粒复制)和 parA、parB(控制拷贝数)等成分。
三、鸟枪法序列测定技术及其改良
受序列分析技术限制,一次测序的长度不能超过 1kb , 目前往往采用所谓的全基因组鸟枪法测序 技术,随机挑选插入基因组 DNA 的质粒做测序反应,然后用计算机程序进行序列拼接
基因组 DNA 的鸟枪法测序原理示意图
鸟枪法测序的缺点:
随着所测基因组总量增大,所需测序的片段大量增加,各个片段重叠成一个连续体的概率是 2n2 - 2 n 。其次,高等真核生物(如人类)基因组中有大量重复序列,导致判断失误
鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列
对鸟枪法的改进:
大片段克隆法:首先用稀有内切酶把待测基因组降解为数百 kb 以上的片段, 再分别测序。
靶标鸟枪法:首先根据染色体上已知基因和标记的位骆来确定部分 DNA 片 段的相对位骆,再逐步缩小各片段之间的缺口。
四、大规模 DNA 序列拼接
对于 DNA 测序的技术只能一次测序大约 1kb 左右的 DNA 序列,可是人类的 DNA 全长大约为 30 亿个,大约是 300 万个 1kb 的集合。如果 DNA 测序能够沿模板次序进行,一次 1kb 可能也不是问题,只不过重复的次数多了些。
事实上,每次测序是在染色体 DNA 中随机取一小段,因此,把这些随机的小片段按原样拼接产生完整的 DNA 序列就成为基因序列分析中亟需解决的最关键的问题。
第 二 节 人类基因组计划
基因组
基因组学这一名词是美国人 T. H . Roderick 在 1986 年 7 月造出来的,与一个新的杂志— Genom-ics 一道问世,它着眼于研究并解析生物体整个基因组的所有遗传信息。
基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部 DNA 分子的总和。人类基因组 包括 23 对染色体,单倍体细胞中约有 30 亿对核苷酸,编码了 5 - 6 万个基因,人类基因组中携带了有 关人类个体生长发育、生老病死的全部遗传信息。
从整体上看,不同人类个体的基因是相同的,因此,我们说“人类只有一个基因组 ”,人生来是平等的。当然,不同的人可能拥有不同的等位基因,这一点决定了人与人之间个体上的差异。
一、人类基因组计划的科学意义
到目前为止,已经完成了酵母、线虫、果蝇、拟南芥、人类、小鼠和水稻等 7 个真核生物基因组以及大肠杆菌等上百个原核生物基因组。
人类基因组计划的科学意义在于:
(1)确定人类基因组中约 3 - 4 万个编码基因的序列及其在基因组中的物理位置,研究基因的产 物及其功能。
(2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。
(3)从整体上了解染色体结构,了解各种不同序列在形成染色体结构、DNA 复制、基因转录及表达调控中的影响与作用
(4)研究空间结构对基因调节的作用。
(5)发现与 DNA 复制、重组等有关的序列。
(6)研究 DNA 突变、重排和染色体断裂等,了解疾病的分子机制,为疾病诊断、预防和治疗提供理论依据
(7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。
(8)研究人类个体之间的多态性(SNP)情况,用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。
二、遗传图
人类基因组计划的成果是多方面的,它主要体现在鉴定基因的四张图上。
遗传图又称连锁图 , 是指基因或 DNA 标志在染色体上的相对位骆 与遗传距离,通常以基因或 DNA 片段在染色体交换过程中的分离频率厘摩(cM) 来表示。cM 值越大,两者之间距离越远
产生配子的减数分裂过程中,亲代同“号 ”的父源或母源染色体既能相互配对也可能发生片段互 换,而父母源染色体等位基因互换导致子代出现 DNA “重组 ”的频率与这两个位点之间的距离呈正相关,所以,用两个位点之间的交换或重组频率来表示其“遗传学距离 ”。
第一代 DNA 遗传标记是 RFLP(限制性片段长度多态 性)。DNA 序列上的微小变化,甚至 1 个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。
第二代 DNA 遗传标记利用了存在于人类基因组中的大量重复序列:
重复单位长度在 15 - 65 个核苷酸左右的小卫星 DNA;
重复单位长度在 2 - 6 个核苷酸之间的微卫星 DNA
( microsatellite DNA) , 后者又称为简短串联重复(STR、STRP 或 SSLP ,)
第三代 DNA 遗传标记,可能也是最好的遗传标记,是分散于基因组中的单个碱基的差异,即单核苷酸的多态性(SNP) , 包括单个碱基的缺失、插入和替换。
SNP 中大多数为转换,即由一种嘧啶碱基替换另一种嘧啶碱基,或由一种嘌呤碱基替换另一种嘌呤碱基,颠换与转换之比为 1:2 。
SNP 有可能在密度上达到人类基因组“多态 ”位点数目的极限。估计人类基因组中可能有 300 万个 SNP 位点!
SNP 与 RFLP 和 STRP 标记的主要不同之处在于,它不再以 DNA 片段的长度变化作为检测手段,而直接以序列变异作为标记。
“遗传图 ”的建立为人类疾病相关基因的分离克隆奠定了基础。拥有 5000 多个遗传学位点,相当 于把整个人类基因组划分为 5000 多个小区,并分别设骆了“标牌 ”。如果在家系中证实该基因与某个标记不连锁(重组率为 50% ) , 表明该基因不在这一标记附近。
如果发现该基因与某个标记有一定程度的“连锁 ”(重组率小于 50% 但大于 0) , 表明它可能位于这个标记附近。
如果该基因与某标记间不发生重组(重组率等于 0) , 我们就推测该标记与所研究的疾病基因可能非常接近。
三、物理图
人类基因组的物理图是指以已知核苷酸序列的 DNA 片段(序列标签位点, STS)为“路标 ”,以碱基对(bp , kb , mb)作为基本测量单位(图距)的基因组图。
物理图的主要内容是建立相互重叠连接的“相连 DNA 片段群 ” 。
四、转录图
人类的基因转录图(cDNA 图),或者基因的 cDNA 片段图,即表达序列标签图(EST )是人类基因组图的雏型。
在成年个体的每一特定组织中,一般只有 10% ~ 20% 的结构基因(约 1 ~ 2 万个不同类型的 mR-NA)表达。
五、人类基因组的序列图
人类基因组的核苷酸序列图是分子水平上最高层次、最详尽的物理图。测定总长约 1 米、由 30亿个核苷酸组成的全序列是人类基因组计划的最终目标。
不同种族、不同个体的基因差异(基因组的多样性)以及 “正常 ”与 “疾病 ”基因的差异,只是同一位点上等位基因的差异,所以,人类基因组全序列来自一个“代表性人类个体 ”,不属于任何供体。
第 三 节 比 较基因组学及功能基因组学研究
比较基因组学(Comparativegenomics)及功能基因组学研究基因组的序列可被分为三类:
(1)通过比较确知其生理功能的;
(2)在数据库中有相匹配的蛋白质序列,但并不知道其功能的;
(3)在现有数据库中找不到任何相匹配的蛋白质序列的新基因。
一、通过基因组数据进行全局性
低等真核生物如酵母、线虫以及高等植物拟南芥,不但基因组比较小,基因密度比较高,百万碱基对中含有 200 个或更多的基因,基因组 90% 以上由常染色质组成
部分典型真核和原核生物基因组成份分析
A . 人 β- T 细胞受体位点,在 50kb 大片段中只有一个基因(TRY4 , 编码胰蛋白酶原),一个假基 因(TRY5 ) , 两个基因片段(V28 , V29 - 1)和 52 个存在于全基因组范围内的重复序列,编码功能基因 的序列占总序列不到 3% 。
B . 酵母第Ⅳ号染色体中的一个片段,其中包括 26 个蛋白质编码基因,2 个tRNA 基因,5 个存在于 基因组范围内的重复序列,编码功能基因的序列占总序列的 66 . 4% , 重复序列占 13 . 5%(在所有 16 条酵母染色体中,重复序列只有 3 . 4% ) 。在该 50kb 序列中,所有基因都不带内含子,在整个酵母基因组中,一共只有 239 个内含子,而一个人类基因就可能有多达 100 个内含子
C . 在 50kb 玉米基因组中,只有 1 个基因,乙醇脱氢酶 I - F 基因,其余几乎都是重复序列。在它 的 5000Mb 基因组序列中,50% 以上可能是重复序列。
D . 大肠杆菌基因组中,50kb 序列中可能有 43 个基因(占全序列的 85 . 9% ) , 许多基因之间甚至连一点空间都没有( thrA 和 thrB 之间只隔了一个碱基,thrC 基因直接位于 thrB 终止子的下游。
原核生物基因中没有内含子(少数古细菌基因中可能存在极少的内含子)。原核基因组中没有重复序列,但已发现存在某些插入序列(IS186 , IS1) 。
果蝇和人类基因组中异染色质的比例较高,占基因组的 20% ~ 40% 。研究果蝇核 DNA 发现,其 Y 染色体几乎完全异染色质化,第四号染色体也大部分被异染色质化,其 X 染色体在不同家系中变化最大,其异染色质化程度从 30% 到 50% 左右不等
图 11 - 18 果蝇染色体中常染色质和异染色质含量比较
表 11 - 4 基本完成 DNA 序列分析的真核生物基因组比较
大肠杆菌基因组中,尚有 38% 以上的未知蛋白质。与物质运转和能量代谢相关的蛋白质含量分别占蛋白质总量的 9% 左右。各种功能性酶、细胞结构蛋白、调控蛋白、细胞周期相关因子及参与蛋白质合成、参与重要中间物合成与代谢等过程的蛋白质分别占总蛋白的 4% 以上。参与氨基酸合成及代谢,参与 DNA 合成及代谢的蛋白质也都达到总蛋白的 3% 左右。
表 11 - 1 大肠杆菌、伤寒杆菌和尿殖道支原体基因组中的基因总量比较与功能分析
表 11 - 5 大肠杆菌所编码的蛋白质分类核基因长度(kp)
人类基因的平均长度为 27kb 左右,含有 8 . 8 个长约 145bp 的外显子,内含子的长度却达到 3365bp 左右,3 ’非翻译区(UTR)的平均长度为 770bp , 5 ’非翻译区的平均长度为 300bp , 开放读码框的平均长度只有 1340 bp , 编码 447 个氨基酸。
原始生物中单拷贝基因较多,流感嗜血杆菌中单拷贝基因占 88 . 8% , 酵母中占 71 . 4% , 果蝇中占72 . 5% , 线虫中占 55 . 2% , 拟南芥中只占约 35 . 0% 。
尿殖道支原体带有已知最小的基因组,可依此确定能自我复制的细胞必需的一套最少的核心基因
生物信息学:一 门交叉学科,包含了生物信息的获取、处理、存储、分发、分析和解释等在内的上所有方面,它综合运用数学、计算机科学和生物学的各种工具来阐明和理解大量数据所包含的生物学意义
比较基因组学:在基因组图谱和序列分析的基础上,对已知基因和基因组结构进行比较,了解基因的功能、表达调控机制和物种进化过程的学科。
二、通过基因组数据进行比较基因组学研究
流感嗜血杆菌的基因组为 1 . 83Mb , 而尿殖道支原体的基因组只有 0 . 58Mb , 二者相差 3 倍多,那么,基因组大小影响了基因数目还是基因尺度?
流感嗜血杆菌基因大小平均 900bp , 尿殖道支原体的基因为 1040bp , 基因大小差不多。流感嗜血杆菌中平均 1042bp 有 1 个基因,尿殖道支原体中平均 1235bp 有 1 个基因。可见基因组尺度减小并不引起基因密度的增加和基因本身尺寸的减小。
表 11 - 8 流感嗜血杆菌和尿殖道支原体各类主要基因比较
通过对流感嗜血杆菌和尿殖道支原体这两个亲缘关系较远的生物基因组的比较,选取其共同的基因(共 240 个),再加上一些其他基因,最后组成一套含 256 个基因的最小基因组。
单细胞真核生物酿酒酵母基因组为 12 068kb , 比单细胞的原核生物和古细菌大一个数量级。
酿酒酵母基因组共有 5887 个 ORF , 比原核生物和古细菌要多得多。酿酒酵母的基因密度为 1个基因/2kb , 小于原核生物流感嗜血杆菌和尿殖道支原体等。
酿酒酵母是最小的真核基因组,裂殖酵母其次,其密度是 1 /2 . 3kb 。
简单多细胞生物线虫的基因密度为 1 /30kb 。酿酒酵母只有 4% 的编码基因有内含子,而裂殖酵母则有 40% 编码基因有内含子。
三、功能基因组学研究
整个基因组序列的获得为生物学带来了一种称为功能基因组学的新方法,即在基因组水平上阐明 DNA 序列的功能
人类和各种模式生物的全长 cDNA 克隆对基因的发现及功能分析都极为有用,因此,获得全长cDNA 的技术和发现稀有转录物的技术都将被放在高度优先的地位。
cDNA RACE (cDNA 末端快速扩增)
是用于从已知 cDNA 片段扩增全长基因的方法,它根据已知序列设计基因片段内部特异引物,由该片段向外侧进行 PCR 扩增得到目的序列。用于扩增 5 ’端的方法称为 5 ’RACE , 用于扩增 3 ’端的称为 3 ’RACE
5 ’RACE
在反转录酶的作用下,以已知基因片段内部特异性引物启始 cDNA 第一条链的合成
RNase 混合物降解模板 mRNA , 纯化 cDNA第一条链
用 末 端 转 移 酶 在 cDNA3 ‘端 加 入 连 续的 dCTP
以连有 oligo( dG) 的锚定引物和基因片段 内部特异 nested 引物进行 PCR 扩增,以期得到目的片段,并可用 nest PCR 进行检测
3 ’RACE
在反转录酶的作用下,以连有可以和 polyA 配对的 oligo( dT) 的锚定引物启始 cDNA 第一条链的合成
用 RNaseH 降解模板 mRNA 。
用通用锚定引物和基因片段内部特异引物 进行 PCR 扩增得到目的 3 ‘片段,并可用 nest PCR的方法继续进行检测和扩增