导图社区 南京大学分子生物学
导图内容来自中国大学MOOC网站,南京大学郑伟娟老师主讲《分子生物学》,更新了部分内容
编辑于2022-06-08 17:28:53南京大学-分子生物学
第五章 DNA损伤修复和突变
概述
损伤-化学改变,比如甲基化修饰
突变-碱基对改变
生物大分子中只有DNA损伤后被修复
如果损伤不能及时修复
大部分肿瘤与DNA修复机制的缺陷有关
影响DNA的复制和转录
导致突变
加速细胞老化
DNA分子拷贝数少:必须
DNA结构决定其容易修复:可以
DNA损伤类型
造成DNA损伤的因素
内在因素
DNA结构本身的不稳定-主要指碱基
DNA复制中碱基错配
氧自由基-reactive oxygen species,ROS
活泼化学性质,可以和碱基反应
环境因素
化学因素
化学诱变剂如黄曲霉素、烷基化试剂等
物理因素
紫外辐射
离子辐射(X射线和γ射线)
DNA损伤的类型
碱基损伤
碱基丢失
糖苷键断裂造成的无碱基位点
脱嘌呤最普遍,黄曲霉素可加剧
碱基转换
脱氨基反应
自发地或者在某些化学试剂(如亚硝酸)作用下发生
A-I(次黄嘌呤) C-U
碱基修饰
烷基化:亲电性的烷基化试剂可以将含碳基团加到DNA的碱基上,alkylation
harmless:不改变碱基配对性质
G-N7
dangerous:碱基不能与其他任何碱基配对,造成DNA复制阻滞
A-N3
导致突变:不会造成DNA复制阻滞,但改变配对性质
EMS-甲基磺酸化乙酯
G-O6
致癌物:导致突变发生在与细胞分裂有关基因中的烷基化试剂
氧自由基
碱基交联
Ultraviolet (UV) Radiation导致同一条DNA链中 相邻的嘧啶之间发生交联,形 成嘧啶二聚体
阻断DNA复制或导致突变
碱基错配
在DNA复制中产生、没有被校对作用“纠正”的错配碱基
DNA链损伤
DNA链断裂
X射线和γ射线比UV能量更高,使DNA周围分子特别是水分子离子化,形成自由基,进攻DNA,损伤碱基或者造成链的断裂
DNA链交联
双功能试剂(顺铂、丝裂霉素)
另见: UV可诱导DNA和蛋白质形成共价交联
DNA与蛋白质之间的交联
UV可诱导DNA和蛋白质形成共价交联
DNA损伤修复机制
直接修复
特征
损伤DNA的直接逆转-“修旧如旧”
高度特异性,只需要一种基因产物的参与
通常非常耗能,但具有动力学优势(比多步骤的修复过程更快)
种类
光复活-Photorectivation or light repair
切断TT二聚体间的单键
光复活酶-photoreactivating enzyme
含有补光色素
利用所吸收的光能:蓝光或近紫外光
胎盘类哺乳动物没有
机制
图示
1) 酶识别并与损伤部位结合
2) 捕光色素吸收光能,酶被激活
3) 捕光色素将一个电子转移给环丁基二聚体
4)二聚体变得不稳定,进行一系列的电子重排,最终形成嘧啶单体
烷基化损伤的修复
G的O6烷基化修复
E.coli到人都可修复
E.coli-Ada酶
6-烷基鸟嘌呤、4-烷基胸腺嘧啶等
失活后成为正调节物,诱导包括自身基因在内的多种基因表达
可以被烷基化的DNA诱导表达
一直处于烷基化环境中的细菌比其他细菌对烷基化试剂具有更高的抗性
每次修复都要消耗一个蛋白质分子
SSB DNA的连接
DNA连接酶
大多数DNA损伤类型是无法直接修复的
切除修复
特征
多步骤
能修复大多数的DNA损伤-“切掉旧的 补上新的”
一般步骤
识别(Recognize)
切除(Remove)
再合成(Resynthesize)
再连接(Religate)
种类
碱基切除修复
另见: 核苷酸切除修复
概述
Base excision repair,BER
修复异常的碱基
机制
原核
DNA glycosylase 识别损伤碱基,切断糖苷键,留下一个AP位点-apurinic orapyrimidinic site
AP endonuclease 在AP位点的5’或者3’端切断DNA链(切掉碱基),产生nick
DNA phosphodiesterase切除AP位点的糖和磷酸基团,留下gap
DNA pol Ⅰ和DNA ligase填补缺口
真核
DNA聚合酶β和APE1共同作用,行使校对功能
DNA糖苷酶是主要酶
核苷酸切除修复
特征
Nucleotide excision repair,NER
修复大的结构变化和双螺旋结构的异常
可以识别DNA损伤区异常的化学变化,也可以识别异常的结构
基本步骤
识别损伤
一个蛋白质复合物结合到损伤位点
在离开损伤位点几个核苷酸的5’和3’端切开损伤链
切除两个nick之间、包含损伤位点的DNA片段
Gap Filling
Ligation
E.coli中的NER
流程
2 分子UvrA与1分子UvrB形成复合物-ATP dependent
复合物识别UV损伤位点(依靠DNA的弯折)
ATP水解,UvrA从复合物中解离,UvrB仍然结合在损伤位点
UvrB招募UvrC形成复合物
UvrC激活UvrB,在嘧啶二聚体的3'端4 nts的位置切开DNA; UvrB激活UvrC,在嘧啶二聚体的5'端7 nts的位置切开DNA-产生nick
解螺旋酶 UvrD,利用ATP水解产生的能量, 使损伤DNA片段解链,UvrC离开损伤位点
gap由DNA Pol I orII fill in,同时UvrB 离开
DNA ligase连接 nick
人体NER
对修复UV诱导的DNA损伤非常关键-人体没有光复活酶
区别
涉及蛋白质不同
切除DNA片段为24-32nt(细菌中为12-13nt)
流程
XP-C识别嘧啶二聚体、与之结合、导致DNA的局部解螺旋
XP-A与嘧啶二聚体集合,帮助招募其他蛋白质,形成复合物
XP-B和XP-D都是解螺旋酶,扩大损伤位点附近DNA的解螺旋区域
招募核酸酶:XP-G在3’端、XP-F(ERCC1)在 5’端切开DNA; RPA(SSB)与未损伤DNA结合,帮助酶的正确定位
切开的DNA片段被去除,gap由DNA Pol δ or ε fill in
图示
参与NER蛋白质缺陷会导致遗传性疾病
着色性干皮病(XP)
另见: NER也负责修复由化学因素导致的改变DNA结构的损伤
NER也负责修复由化学因素导致的改变DNA结构的损伤
类型
global genome NER(GG-NER)
负责修复整个基因组中的DNA损伤
速度慢,效率低
transcription-coupled NER(TC-NER)
专门修复正在转录的基因的模板链上的损伤
速度快,效率高
区别在于识别损伤的机制
GGR-XPC
TCR-RNA pol Ⅱ
RNA聚合酶在损伤处暂停,被相关蛋白识别并取代,招募UvrA、UvrB复合物,起始NER
excision nuclease-切除核酸酶/excinuclease-切割酶 E.coli中uvrABC endonuclease
错配修复
Mismatch repair, MMR
DNA复制未完成时修复错配碱基
进一步提高复制的忠实性(100-1000倍)
主要问题:如何区分亲本链和新合成的子链
E.coli
甲基化程度不同
甲基化酶识别GATC序列,并甲基化A/250bp
只能识别未完成复制的错配碱基
都未甲基化
修复可以进行
易造成突变
都被甲基化
修复效率极低
易造成突变
参与错配修复的基因-mutS,mutH,mutL
mutS,mutL高度保守
mutH在真核生物中没有对应物
真核生物区分机制不清楚
机制
低效率、高耗能
GATC片段与错配碱基之间的距离可能很远,被切除的片段、需要修补的gap很长
mutS识别错配碱基,并与之结合
MutL与MutL结合,稳定复合物
MutL-MutL复合物激活MutH,后者位于邻近的甲基化位点, 在甲基化位点的互补链(新生链)上产生一个nick
解螺旋酶UvrD从nick处、向错配碱基方向,解开DNA链,一种单链DNA特异性的exonuclease 降解解开的DNA链
DNA pol Ⅲ和DNA ligase填补缺口
其他机制
MutY-short patch repair
very short patch repair
缺陷导致遗传病
hereditary nonpolyposis colon cancer ,HNPCC
错配修复机制的缺陷导致的微卫星DNA的不稳定性
机制相似
DSB的修复
类别
同源重组
准确性较高,见于酵母
非同源末端连接
准确性低,见于哺乳动物
机制
Ku70/Ku80异源二聚体与DNA断裂末端结合,保护末端免被降解
Ku有依赖于DNA的ATPase活性——结合DNA后ATPase活性被激活
Ku是依赖于DNA的蛋白激酶(DNA-PK)的调节亚基
Ku招募DNA-PK的催化亚基(DNA-PKcs)以及受DNA-PKcs调节的核酸酶Artemis蛋白到DNA末端,组装成DNA-PK复合物; 复合物中有DNA末端结合位点以及邻近的dsDNA的结合位点,因此可以促进DNA的联会;
DNA-PKcs与DNA末端结合后,蛋白激酶活性被激活,两分子DNA-PK彼此磷酸化,DNAPKcs的磷酸化促使其解离,Ku的磷酸化激活其helicase活性;Ku解开DNA末端,促使同源序列配对
Artemis蛋白磷酸化后核酸酶活性被激活; 水解DNA单链末端
Ligase连接DNA末端
末端碱基缺失,总是会造成突变
重组修复
复制后修复
依赖于同源重组机制
复制后,损伤依然存在,等待真正的DNA损伤修复
跨越合成
由特殊的DNA pol在损伤位点上随机添加核苷酸
E.coli
SOS反应的一部分,也称SOS修复或易错修复
最重要的是LexA and RecA
LexA
阻遏蛋白,阻遏所有SOS基因表达
二聚体,每个单体含有1个DNA结合结构域和1个二聚化结构域
只有二聚体可以与DNA结合、阻断SOS基因的表达
LexA在SOS机制开启时合成后即被降解——为了确保能迅速被关闭
RecA
辅蛋白酶-coprotease,辅蛋白酶活性可以被UV或其他损伤因素激活
另见: 只有二聚体可以与DNA结合、阻断SOS基因的表达
SOS反应
DNA pol Ⅴ
形成
umuC 、umuD 在一个操纵子中,受 LexA的调控
UmuD 被 LexA切割,形成 UmuD',UmnD'与UmuC形成 UmuD'2C复合物
在损伤位点随机添加核苷酸
如果umu genes发生突变,细菌就不容易发生突变
umu-unmutable
人体中参加跨越合成的酶进行性很低,无校对功能
error-prone bypass
突变风险增加,但利大于弊
如果一个细胞在修复损伤之前就复制了其受损伤的DNA, 然后进行分裂,那么一个子代细胞中的DNA在损伤位点对应 的子链上就会留下一个gap,此时切除修复或者重组修复都不 可能进行,因此易错的跨越合成是细胞避免死亡的最后一招。
DNA突变
定义:发生在DNA上的可遗传的永久性结构变化
突变的类型和后果
点突变-point mutation
主要形式为碱基对置换
转换-transition
颠换-transvertion
后果取决于点突变的位置和方式
位置
编码区
非编码区
方式
沉默突变/同义突变-silent/samesense mutations
GAA(E)-GAG(E)
错义突变-missense mutations
GAA(E)-AAA(K)
无义突变-nonsense mutations
GAA(E)-TAA(stop)
移码突变-frameshift mutation
后果与突变位置有关
与起始密码子越近,影响越大
中性突变:不改变表型的突变
突变的原因
DNA损伤不能及时修复会造成突变,引起DNA损伤的因素也可能导致DNA突变
类别
自发突变-spontaneous mutation
自发点突变
碱基异构
自发脱氨基
氧自由基
碱基的烷基化
自发移码突变
复制打滑
转座
诱发突变-induced mutation
诱发点突变
碱基类似物
5-溴尿嘧啶,酮式-A,烯醇式-G
烷基化试剂
甲基甲烷磺酸-MMS
脱氨基试剂
亚硝酸
羟胺
诱发移码突变
DNA嵌入试剂
吖啶衍生物(原黄素)
图示
突变的校正
突变类型
正向突变-forward mutation
改变了野生型性状的突变
回复突变-reverse mutation
发生在起始突变位点、恢复野生型性状的第二次突变
校正突变-suppressor mutation
发生在非起始突变位点上的假回复突变
纠正突变性状
校正类型
基因内矫正
与起始突变发生在同一基因内
基因间校正
发生在另一个基因上(校正基因)
常见tRNA基因
增变基因-mutator gene
DNA polymerase 相关基因
3'——5' editing function mutation
错配修复系统的基因
MCE (mismatch correction enzyme)
DNA 损伤修复系统基因
错配修复功能丧失——突变率升高
第六章 DNA重组
概念
是指发生在DNA分子内或DNA分子之间核苷酸序列的交换、重排和转移现象,是已有遗传物质的重新组合过程 DNA recombination
作用
生物体利用重组产生新的基因或等位基因组合
病毒利用重组将自身DNA整合到宿主DNA中
生物体利用重组进行DNA损伤修复
基因工程技术
基因敲除-Gene knockout
遗传作图-Genetic mapping
分类
同源重组-Homologous recombination
定义
发生在DNA的同源序列之间,不依赖序列的特异性,只依赖序列的同源性
包括细菌的接合-conjugation、转化-tranformation和转导-tranduction以及真核细胞在同源染色体之间发生的交换等
机制
Holliday模型
1964 Robin Holliday 1976 Robin Holliday David Dressler&Huntington Potter
机制
两个同源的DNA分子相互靠近 对应的位置各产生1个单链断裂;
被切开的链相互入侵、交换、连接,形成Holliday中间体
Holliday中间体的拆分
noncrossover重组
crossover重组
图示
增加分支迁移步骤
不足
两个DNA分子作用相同——实际上一个DNA分子优先作为供体
没有解释单链切口如何产生
单链断裂模型
Matthew Meselson & Charles Radding-1975
只需要在重组位点产生一个单链断裂,DNA可以自发或在压力下产生单链断裂
左meselson
右raddiing
nick 和 gap都能启动重组
双链断裂模型
需要在一个DNA分子中产生双链断裂DSB
带有DSB的DNA分子作为重组受体recipient
不带DSB的分子作为重组供体donor
大肠杆菌中的同源重组途径
RecBCD途径
大肠杆菌中最重要的同源重组途径
基本吻合单链断裂模型,起始于RecBCD蛋白在特定序列3'端产生nick
χ(chi)位点,5'-GCTGGTGG-3'
chi-crossover hotspot instigator,交换/重组热点启动器
主要蛋白
RecA-损伤修复、参与重组
所有重组途径都需要
促进链的交换、ATPase和co-protease
必需满足条件
副主题
可以和ssDNA结合,每一个RecA单体覆盖4-6个Nts
ssB和ssDNA的结合具有协同性,形成的复合物也非常稳定
RuvA
RuvB
RuvC
RecE途径
RecF途径
减数分裂重组
位点特异性重组-Site-specific recombination
转座重组-Transposition recombination
第四章 DNA的生物合成
DNA复制的一般特征
DNA的半保留复制
定义:亲代双链DNA分子在DNA聚合酶的作用下,分别以每条单链DNA分子为模板,聚合与自身碱基可以互补配对的游离的dNTP,合成出两条与亲代DNA分子完全相同的子代DNA分子的过程。
实验
示踪:同位素标记法
思路:N15标记,N14培养;不同时间提取DNA,进行CsCl密度梯度离心
图示
缺陷:未能直观观察到DNA复制过程
改进实验
副主题
DNA的双向复制
复制从DNA分子的特定位置开始,复制起点/复制原点 (origin, O)
能够独立进行复制的基因组单位:复制子(replicon)
一个复制子只含有一个复制起点
DNA链从5′→3′延伸
双向对称进行
原核:等速,单复制子
解释大肠杆菌为什么在丰富培养基中复制快?
多复制叉
真核:多复制子
完全单向
质粒colE1
实验设计:取同一个限制性核酸内切酶位点,复制泡逐渐增大;复制泡上方的DNA保持不变;复制泡下方的DNA逐渐缩短
滚环复制-Rolling circle replication,σ复制
单链环状噬菌体Φx174、M13产生大量正链DNA
λ噬菌体产生双链DNA
真核生物特定基因通过滚环复制增加基因拷贝数
非洲爪蟾卵母细胞rRNA基因
哺乳动物细胞的二氢叶酸还原酶基因
D-环复制,取代环复制
细胞器DNA
DNA的半不连续复制
semi-discontinuous
pulse-chase experiment
DNA连接酶缺失时,由于U的掺入而产生的片段不能得到连接,密度梯度离心结果只有短片段
continuous systhesis-leading strand
discontinuoous synthesis-lagging strand
DNA复制的酶学
综述
DNA的复制需要多种酶的蛋白质的参与
这些酶和蛋白质在复制叉处组装成复合物、负责DNA的合成,称为复制体-replisome
DNA聚合酶
DNA dependent/directed DNA polymerase-DDDPase
特征
模板:模板链阅读方向3'-5',合成方向5'-3'
需要引物,不能从头合成
DNA、RNA甚至蛋白质
要求有游离3'羟基端
底物:必须是dNTP
反应理论上可逆,但产物焦磷酸消耗,体内不可逆
原核E.coli DNA聚合酶
DNA pol Ⅰ-多功能酶
聚合酶活性
5'-3' 核酸外切酶活性
另见: 聚合酶活性
特有:5'-3' DNA聚合酶活性
另见: 5'-3' 核酸外切酶活性
可以成段切除,可以切除已配对的核苷酸
切刻平移-nick translation
nick:只有磷酸二酯键的断裂,没有碱基缺失
gap:有碱基缺失
缺口填补 gap fill-in
作用
不是负责DNA复制的主要酶
DNA pol Ⅰ突变菌株可以正常分裂
DNA pol Ⅰ的进行性不高
进行性-processivity
聚合酶从模板链上解离下来之前所能添加的核苷酸数
DNA损伤修复
E.coli 突变菌株 polA- 对UV非常敏感
Nick translation
Gap fill-in
short lengths of DNA synthesis
DNA pol Ⅱ
有3'-5'核酸外切酶活性,没有5'-3'核酸外切酶活性
在DNA repair 中起作用
DNA pol Ⅲ
特性
高聚合酶活性,是pol Ⅰ的50倍
含量较少,10-20分子/cell(1-400)
有3'-5'核酸外切酶活性
高进行性
组成
结构图示
α、ε的活性彼此促进,与游离状态相比,分别提高2倍和10-80倍
τ亚基-连接作用
β亚基-滑动钳,进行性因子
钳载复合物-帮助β亚基装载和卸载
复制机制图示
聚合酶活性高
体外700nt/sec,E.coli合成速度1000nt/sec
进行性高
体外30kb
真正的复制酶
比较
DNA pol Ⅳ&Ⅴ
error-prone DNA pol
在DNA损伤修复中起作用
Ⅳ在细菌生长稳定期表达
Ⅴ在SOS反应时表达
真核生物聚合酶
DNA pol α-引物合成
引发酶活性,负责合成RNA引物
没有3'外切酶活性,无校对作用
在复制起始区,先合成短的RNA引物(约10nt),再合成20-30nt DNA,然后被δ和ε取代
DNA pol β-DNA repair
最小的DNA pol
进行性极低
没有3'外切酶活性
DNA pol γ-线粒体DNA合成
有3'外切酶活性
DNA pol δ-DNA链的延伸
内在进行性低,但在PCNA存在时进行性增加40倍
PCNA-proliferating cell nuclear antigen
增殖细胞核抗原
yeast PCNA三聚体结构和β clamp非常相似
负责DNA合成的主要酶
3'外切酶活性
DNA pol ε-DNA repair
内在进行性高
3'外切酶活性
争议:是否负责冈崎片段的合成
类似原核DNA pol Ⅲ
DNA解螺旋酶
helicase
共性
促进DNA双链解开
结合DNA
与碱基序列无关
多数优先结合单链区
结合NTP
具有内在的依赖于DNA的NTPase活性
水解NTP为解链提供能量(解氢键)
多数优先或只能结合ATP
移位酶活性:沿着结合DNA单向移动,1000nt/s
极性
3'解链酶
5'解链酶
双极性酶
E.coli中DnaB
单链DNA结合蛋白
SSB single-strand binding protein
选择性地与单链DNA结合
防止单链DNA重新形成双链
防止单链DNA的降解
原核SSB与单链DNA的结合具有协同性
真核SSB已知参与DNA复制
DNA拓扑异构酶
topoisomerase
消除DNA扭曲张力(正超螺旋),引入负超螺旋
分类
Type Ⅰ:催化DNA的一条链发生断裂和再连接,不需要能量
Type Ⅱ:两条链,需要能量
E.coli DNA gyrase
TypeⅡ:负责在复制过程中、在复制叉前消除由于复制叉前进带来的扭曲张力;消除正超螺旋、引入负超螺旋
A2B2
真核生物拓扑异构酶 Ⅰ
DNA引发酶
primase/priming
区分于引物酶
两条子链合成都需要引发
引物都是10-12nt的RNA
E.coli和大多数噬菌体中DnaG 为primase
引发体
引发体=预引发体+引发酶;primosome=preprimosome+primase
负责引物合成
负责引物合成
DNA连接酶
催化一条链的5'-磷酸末端与另一条链的3'-OH末端形成磷酸二酯键
只能连接处于nick(与同一条DNA互补配对),不能连接游离的两条单链DNA
连接反应消耗能量
细菌:NAD
真核生物、病毒、噬菌体:ATP
连接末端分类
E.coli DNA ligase连接粘性末端
噬菌体T4 DNA ligase连接平头末端
DNA复制的详细机制
复制的起始
从特定位置开始-复制起点
多个短的重复序列
富含AT碱基对
呼吸现象:氢键迅速断裂与再生,DNA两条链不断解链与聚合,形成瞬间的单泡状结构
被结合蛋白识别
DNA结合蛋白与复制原点处富含AT碱基对的重复 序列的相互作用,促进了DNA复制的起始
E.coli
复制起点oriC
至少245bp的一段序列
4*9bp repeats:TTATCCACA
另见: 3*13bp repeats
3*13bp repeats
DnaA蛋白与9bp重复序列的结合,改变了DNA的构象,促使邻近的13bp重复序列解链
另见: DnaB与起始区结合,形成开放复合物
DnaA有ATPase活性
DnaB与起始区结合,形成开放复合物
其他参与复制起始开放复合物形成的蛋白质
RNA pol
HU protein
小分子碱性DNA结合蛋白,可以诱导DNA的弯折
DnaB
也可促进DnaG的结合和引发
作为解螺旋酶促进DNA的解链
真核生物
病毒SV40
副主题
转录因子spl与GC框的结合可以促进复制的起始
Large T antigen 与ori core的结合,可以起解螺旋酶的作用,解开DNA双链
Primase与宿主的DNA pol α一起促进引物合成
yeast
ARS1-autonomously replicating sequence 1
A,B1,B2,B3
B3具有促进DNA弯折的作用
复制的延伸
原核生物
DNA pol Ⅲ
高进行性-β亚基和γ复合物
β亚基既可以和核心酶结合,也可以和γ复合物结合
游离状态下β亚基优先与γ复合物结合,已经与DNA模板结合时β亚基优先于核心酶结合
γ复合物既有装载作用,也有卸载作用
两种活性都依赖于ATP
取决于DNA状态
单链DNA存在时起装载作用,反之亦然
真核生物
DNA pol δ
内在进行性很低,PCNA存在时进行性增加40倍
PCNA-E.coli DNA pol III的β亚基
一级结构不同,三聚体结构相似
复制的终止
滚环复制
linear concatemer
线性多联体
snipped off
cycling amplification
E.coli
terminator sites,TerA-F
terminus utilization substance,Tus
Tus可以抑制DnaG的解螺旋酶活性
拓扑异构酶 Ⅳ去连环化
真核生物
多复制子,最终形成连环体
依靠拓扑异构酶 II去连环化
冈崎片段的连接
端粒和端粒酶
端粒-telomere:真核生物染色体末端、短的、富含GC的重复序列
端粒序列具有种属特异性
端粒末端结合蛋白-telomere end-binding protein,TEBP
保护端粒免受降解或修复
端粒酶-telomerase:在DNA末端添加端粒序列的酶
1987-证明端粒酶是由RNA和蛋白质组成的核糖核蛋白
RNA充当端粒合成的模板
1996-纯化
p123蛋白具有逆转录酶的特征序列以及手掌形结构中心
逆转录酶-telomerase reverse transcriptase
作用
防止DNA末端萎缩
阻止损伤修复机制将其作为DNA双链断裂末端进行连接
TEBP
哺乳动物DNA二级结构-t loop
与端粒酶结合
不同细胞中活性和长度不同
生殖细胞、肿瘤细胞中端粒酶活性高、端粒长
体细胞中端粒酶活性很低、长度短
正常细胞中寿命一定-the Hayflick limit
思考题
生物体如何保证DNA复制的高保真性?
冈崎实验有没有问题?
第三章 基因、基因组和基因组学
基因的概念
基因认识的三个阶段
染色体遗传学阶段
历史
Mendel遗传因子
性状和遗传因子挂钩
1909W.Johannsen提出“基因”
Morgen连锁遗传规律,基因物质化
基因和染色体挂钩
定义:基因是位于染色体上的、控制遗传性状的、可遗传的独立要素
分子生物学阶段
历史
Avery-基因的化学本质是DNA
DNA的双螺旋结构
one gene one enzyme hypothesis
定义:基因是能够表达和产生基因产物(蛋白质或RNA)的核苷酸序列。包括编码序列、调控序列、内含子和编码区两端的非编码序列。
更新:基因调控区不一定相邻;基因不一定有明确边界,两个编码不同的蛋白质产物的邻近基因,可以共同产生融合蛋白-编码一套相关的功能产物的基因组序列单元
gene-cistron
反向生物学阶段:从基因到表型
分离天然基因,化学合成或设计、改造基因
特征-相关新名词
跳跃基因-jumping gene/movable gene
定义:一些可以在染色体基因组上从一个位置转移到另一个位置,甚至在不同染色体之间跃迁的DNA成分
转座transposition:DNA在基因组中的位置发生转移的现象
相关词汇:转座子transposon/转座元件transposable element
McClintock最早提出
生物体的基因组不是一成不变的整体,而是可以改变和重组的
低等生物中较少而高等生物中较多
断裂基因-spliting gene
定义:真核基因的核苷酸序列中间有与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段。这种编码序列不连续的间断基因称为断裂基因/不连续基因。
R-loop实验
断裂基因转录图示
存在情况
高等真核生物中普遍存在,不仅编码蛋白质的核基因多数是断裂基因,编码rRNA或tRNA的核基因也可能是断裂基因
低等真核生物内含子数目少、序列短,高等反之;随着生物体的进化内含子序列的数目和长度也在增加
少数真核生物基因中没有内含子(组蛋白、干扰素)
少数原核生物(T4噬菌体)中也存在
例外
有些内含子可以编码蛋白质
编码拼接因子
转座酶
有些外显子可以编码氨基酸
人尿激酶基因的第一个外显子的88个核苷酸
起源和生物学意义目前还不完全清楚
有些内含子可以编码蛋白质,蛋白质功能一般与内含子序列转移相关
真核生物细胞器和细菌中所含的内含子分为I型和II型,不同于真核生物细胞核基因中的内含子,这两类内含子都可以进行自我拼接。
有些I型内含子可以编码核酸内切酶,催化自身DNA的转移,即具有转座酶的功能。
有些II型内含子可以编码逆转录酶,催化自身DNA通过RNA介导的机制进行转移。
假基因-pseudogene
定义:核苷酸序列与相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因,通常用ψ表示
主要特征:同源性和非功能性
一般通过序列比对来鉴定
主要类型
加工的processed/逆转座的retrotransposed
一部分加工成熟的mRNA转录产物自发地逆转录为DNA并插入到染色体DNA中。这种假基因通常含有poly A尾巴、内含子已经被拼接去除,缺少正常基因所具有的启动子序列。
非加工的non-processed/复制的duplicated
复制的假基因通常具有基因的所有特征,包括完整的外显子-内含子结构、以及启动子序列。
缺陷的disabled/单一的unitary
各种突变导致基因不能被成功地转录或翻译,如果这样的突变在种群中被固定下来,这个基因就成为没有功能的或者失活的基因。这类假基因的产生机制与非加工的假基因的失活机制相似,差别在于这类假基因在失活之前未被复制。
重叠基因-overlapping gene/嵌套基因-nested genes
定义:不同基因的核苷酸序列共用
发现过程
特征不仅存在于细菌、病毒等原核生物基因中,也存在于高等真核生物基因组中;不仅存在于两个基因之间的二重重叠,也有存在于三个基因之间的三重重叠;不仅存在于编码序列中,也存在于调控序列中。
生物学意义:使有限的DNA序列包含了更多的遗传信息,经济而合理的利用遗传物质;也可能参加基因调控
基因家族-gene family
定义:真核生物基因组中,来源相同、结构相似、功能相关的一组基因
分类:根据家族成员的分布形式
基因簇-gene cluster
定义:基因家族的各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域。它们是同一个祖先基因扩增的产物
e.g.人类类α链基因簇和类β链基因簇
散布的基因家族
定义:基因家族成员在DNA上无明显的物理联系,甚至分散在多条染色体上
e.g.肌动蛋白基因家族和微管蛋白基因家族
分类:根据基因家族成员之间序列的相似程度
序列高度同源的经典基因家族
含有高度保守序列的基因家族
含有短的保守序列的基因家族
序列没有同源性的超基因家族
功能上有相关或相似
重复基因
定义:染色体上存在多个拷贝的基因,主要存在于真核生物基因组中,这些基因往往是与生命活动最基本、最重要的功能相关的基因
e.g.
组蛋白
已知重复基因中唯一具有蛋白质编码机能的基因
不同生物基因组中拷贝数不同
不同生物基因组中排列方式不一样
所有组蛋白基因中都不含内含子,而且保守性很高
不添加poly A尾巴
rRNA基因
tRNA基因
从属重复序列
低等真核生物中,重复序列比例低于20%;高等真核生物中,重复序列比例可以达到50%-80%
分类:按重复次数
中度重复序列:由相对较短的序列组成,重复次数在10~1000次,一般是非编码序列,主要在基因调控中起作用。
高度重复序列:由非常短的序列(小于100 bp)组成,重复次数在上千到上百万次,有些是编码基因,如rRNA基因和某些tRNA基因;多数则是没有转录活性的非编码序列。
分类:按染色体上排列方式
串联重复序列:成簇存在于染色体的特定区域
卫星DNA-satellite DNA:浮力密度与主体DNA不同,在浮力密度梯度离心时,可以形成与主体DNA不同的卫星带
分类:重复单位的核苷酸数
卫星DNA
小卫星DNA
微卫星DNA-2~4个核苷酸单位
多态性和保守性
来源于DNA复制过程中的滑动错配,导致一个或几个重复单位的缺失或插入
用作分子遗传标记,广泛用于基因定位、连锁分析、亲子鉴定
隐蔽卫星DNA-cryptic satellite DNA:浮力密度与主体DNA的相差不大,不能通过浮力密度梯度离心区分,但可以通过其他方法如限制性作图鉴定。
散布重复序列:分散存在于染色体的各个位点
短散布元件-Short interpersed element, SINE:重复序列长度在500bp以下
长散布元件-Long interpersed element, LINE:重复序列长度在1000bp以上
分类:按照功能
结构基因:能够表达出功能产物的基因,包括编码蛋白质的基因和编码RNA的基因
调控基因:参与调控结构基因表达的DNA或RNA序列单元
结构
UTR-非编码区
比较
大小
平均大小-1200bp
真核生物基因大小取决于内含子数目和长度,不同基因差异很大
真核生物基因的长度比其mRNA长度长得多
数目
方法
根据基因组大小计算
基因分离鉴定
测序鉴定ORF-开放阅读框
符合编码结构特征的序列
计算表达基因数目
mRNA种类-表达情况不确定
突变分析
根据人类基因组草图2.5-4*10000
一般而言,生物体基因组大小和所含的基因数随着生物体结构功能复杂性的增加而增加——根本原因在于基因如何表达管理
N值矛盾:生物体复杂性和基因数并不总是正相关
K值矛盾:生物体的复杂性与染色体数并不总是正相关
基因组-genome
概念
起初:一个单倍体细胞中的全套染色体
现代分子生物学:一个生物体中所有遗传信息,由DNA或者RNA编码,包括所有的基因和非编码序列,实际应用时可以包括非染色体遗传元件如病毒、质粒和转座元件等
噬菌体基因组
1976 Walter Fier-RNA病毒噬菌体MS2基因组全序列测定
1977 Fred Sanger -DNA基因组噬菌体ФX174;1983 λ噬菌体
ФX174
单链DNA病毒;5387个碱基,11个基因
非编码区4%
重叠基因和嵌套基因
功能相似的基因聚集成簇
λ噬菌体
双链DNA;61个基因,按照功能成簇排列
线形分子,感染宿主细胞后自身环化成为环状分子,环状称为复制形式
溶原或裂解进行繁殖
细菌基因组
包括两类DNA分子
染色体-携带细胞生存和繁殖所需全部遗传信息
一般只有一个,不同生长条件下可以有多个拷贝
质粒-染色体以外独立存在的DNA分子
治理所携带的遗传信息并非细胞生存必需,存在与否对宿主细胞生存没有决定性作用
大肠杆菌E.coli
1997第一个完整大肠杆菌DNA序列
没有明显的核结构,而形成2-4个DNA相对集中的区域,即类核
每个基因组包含4000-5000个基因,只有约20%的序列是存在于所有基因组中的
染色体DNA是一个由4.6X10^6bp组成的双链环状分子
多种DNA结合蛋白使染色体压缩成一个脚手架scaffold结构, 分成大约100个区domain
蛋白质基因通常以单拷贝形式存在,而RNA基因通常是多拷贝的
功能相关的基因通常串联排列,以操纵子为单位进行表达调控
不同的操纵子可以受同一个调节基因产物的调控,构成调控元
基因组中的基因密度非常高,基因间的平均间隔仅为118bp
酵母基因组
细胞核DNA、线粒体DNA、质粒DNA
1996 酿酒酵母测序
12068 kb;5885个开放阅读框,平均长度1450bp;
基因排列紧密,基因间隔区较短且内含子较少
至少有31%的编码蛋白质的基因或者开放阅读框与哺乳动物编码蛋白质的基因高度同源-人类基因组研究的模式生物
同源性往往仅限于单个的结构域而非整个蛋白质,这反映了在蛋白质进化过程中功能结构域发生了重排
特征
核DNA序列的GC含量不均一,GC含量高的区域一般位于染色体臂的中部,基因密度较高;GC含量低的区域一般靠近端粒和着丝粒,基因数目较为贫乏
含有许多DNA重复序列,包括染色体末端重复序列、散布的单基因重复和成簇分布的基因重复区
植物基因组
2000 拟南芥基因组测序-基因组较小,生活周期短,模式生物
2002 水稻测序,基因组全长466Mb,含有46022-55615个基因
数目多,基因总数在4万左右,几乎是人类基因组基因总数的两倍;
主要通过基因倍增而使基因家族的成员数目增加,但每一成员的功能比较单一
平均长度短,基因的平均长度只有4500个碱基-人类基因平均长度为72000个碱基
人类基因组
1985 HGP提出,1990-2000草图
研究策略
mapping then sequencing(clone by clone)——Francis Collins;
shortgun sequencing——Craig Venter
总体结论
99%以上,出错小于0.01%
2.85Gb,其中有22 287个编码蛋白质的基因,包括2188个基因
可以产生34 214个转录物,平均每个基因可以产生1.5个转录物,说明大量基因存在选择性拼接
共有231 667个外显子,平均每个基因10.4个,外显子序列的总和占人类基因组常染色质的1.2%
人类基因组中包含大量重复序列,这些序列可能是产生新的灵长类特异基因的基础
人类基因组约一半的序列源于转座元件,但大多数转座子处于非活性状态
人类基因组中有许多基因来自细菌的水平转移;因此,人类基因组的形成并不完全源自内部基因的突变和重排,也源自外部基因的引入
举例
22号染色体-1999完成
短臂(22p)为纯异染色质,被认为是基因空白区
长臂(22q)含679个注释基因;包括247个已知基因、150个相关基因、148个预测基因和134个假基因
所有注释基因占全长的39%(含内含子),外显子仅占全长的3%
22q中重复序列占41%;包括大量Alu序列和LINEs
21号染色体-最小的常染色体
唐氏综合症、阿尔茨海默病、肌萎缩性脊髓侧索硬化症
X染色体
与血友病、杜兴氏肌营养不良症等伴性遗传病相关;10%的单基因遗传病定位于X染色体
最重要的ncRNA:可能是32kb的XISTRNA(X非活性特异性转录物RNA),在女性染色体失活中起重要作用
XIST RNA通过覆盖X染色体而导致女性一条X染色体上大多数基因的沉默,这种沉默作用属于顺式作用,即只在同一条染色体上发挥作用,在有活性的另一条X染色体上,XIST基因是关闭的
小鼠基因组
生物医学研究的重要动物模型
与人99%基因相同,只有300个基因特异
细胞器基因组
绝大多数为环状,少数低等真核生物为线性分子
线粒体DNA为几十kb,叶绿体可达二百多kb
细胞器基因组编码自身所需的某些蛋白质、tRNA和rRNA;有自己的蛋白质合成体系;有些蛋白质由核基因编码
DNA利用效率极高;基因排列紧密,间隔区只占DNA总长度的0.5%;有重叠基因
有特殊终止密码子;AGA或AGG(核基因中编码Arg)
C值矛盾
与预期的编码蛋白质的基因数量相比,基因组的DNA含量过多
一些物种的C值与生物体的结构功能复杂性不是正相关
C值:一个单倍体细胞中基因组所包含的DNA碱基对总数,同一种生物体的C值是相对恒定的
低等真核生物中,C值与物种的结构和功能复杂性之间呈正相关;有些真核生物,特别是高等真核生物的C值与生物体的结构功能复杂性不相关
有些结构功能相似的生物体,其C值相差很大
基因组学
定义:研究整个基因组的结构和功能的学科
分类
以全基因组测序为目标:结构基因组学-structural genomics
以基因组功能研究为目标:功能基因组学-functional genomics
转录组学-transcriptomics:研究基因在RNA水平的表达模式,即是否表达以及表达的量
蛋白组学-proteomics:研究所有蛋白质的结构和功能称为蛋白质组学
相关技术
高通量:细胞芯片、二维电泳、质谱技术
生物信息学
第二章 遗传物质的分子本质
遗传物质的分子本质
大多数生物体的遗传物质是DNA
原因
理化性质的稳定性
能够忠实地复制并传递一定程度的可遗传的变异
经典实验
肺炎双球菌活体、离体转化实验
噬菌体转染实验
碱基互补配对A=T G=C
种属特异性而无组织特异性
一些病毒的遗传物质是RNA
RNA病毒(HIV、SARS、禽流感病毒),包含逆转录病毒-致癌RNA病毒
经典实验
前病毒学说和逆转录酶
蛋白质能否充当遗传物质
阮病毒:羊痒疫、疯牛病、人kuru病——海绵状脑炎
Gajdusek-1976诺贝尔奖
proteinaceous infections particle传染性病原蛋白颗粒Prion,由核基因组基因编码
可被蛋白酶K抑制,不被核酸酶和辐射灭活,不含大于100nt核酸
一级结构相同,二级结构PrPc-40%α螺旋,PrPsc20%α螺旋,50%β折叠,变异蛋白降解不充分
PrPSC蛋白的错误折叠形式可以催化天然PrPC分子从正常的可溶性的α螺旋构象向不溶性的β折叠构象转化,最终导致疾病和感染
遗传性状发生改变-表达过程的争议
核酸的结构
双螺旋结构的特征
B型:双股右向螺旋
大沟、小沟
影响双螺旋稳定性的因素
稳定:氢键、碱基堆集力(疏水作用力、范德华作用力)
破坏:静电作用力、碱基分子内能
DNA结构的多态性
采取不同浓度的盐溶液,不同的湿度,得到的DNA稳定构型
Z-DNA只见于嘌呤嘧啶间隔排列的DNA序列
有很强的免疫原性(与抗体结合),一定条件下可以和B-DNA转化,如胞嘧啶5位甲基化
在热力学上不稳定,容易解链;遗传信息暴露在螺旋表面,容易被调控蛋白识别
DNA的多链结构
三链DNA,即H-DNA
四链结构-最早发现于富G单链DNA
与DNA双螺旋结构比较,G-四链体螺旋的热力学和动力学性质都很稳定
富G-DNA序列多见于一些在功能上及进化上都相当保守的基因组区域,
富G-DNA链所形成的四链体结构可能是作为分子之间相互识别的元件之一,在生物体中起着一些特殊作用
DNA的超螺旋结构
原核与真核的区别
原核生物的DNA-共价闭合环的分子结构
真核生物的DNA-线形DNA+组蛋白——核小体-共价闭合环状(ccc-Covalent Closed Circle)
只有cccDNA才能形成超螺旋结构
形成:B-DNA由于螺旋缠绕数的改变
分类
overwinding(右旋)-形成正超螺旋(左手)
unwinding(左旋)-形成负超螺旋(右手)-loop结构的重要生物学意义
DNA在水溶液中,构型偏B型状态,所有生物的DNA几乎有5%为负超螺旋
DNA以10.5 bp/helix为最稳定构型
小于10.5向正超螺旋发展(紧缩态)
大于10.5向负超螺旋发展(松弛态)
对理化性质的影响:超螺旋CCC,开环OC,线性L
RNA的二级结构
dsRNA-A型双螺旋
ssRNA-局部A型,其他为突起、loop结构
特殊碱基配对GU
核酸的变复性
核酸的变性-DNA melting/denaturation
定义:核酸在理化因素的影响下,维持双螺旋结构的作用力受到破坏,稳定的双螺旋结构松散为无规则的单链结构。变性导致核酸理化性质的改变,最重要的是增色效应(OD260增加)
影响因素:凡破坏有利于维持DNA双螺旋结构的作用力(氢键、碱基堆集力)的因素、增强不利于维持DNA双螺旋结构的作用力(静电斥力、分子内能)的因素,都可以促进核酸变性。
有机溶剂破坏氢键-尿素、盐酸胍、甲酰胺
破坏疏水作用力(碱基堆集力)
降低盐离子浓度-增加静电斥力
温度升高-影响分子内能
过酸过碱-影响碱基带电情况-增加静电斥力,影响氢键形成
加热-增加分子内能:热变性是在一个非常窄的温度范围内急剧发生的
Tm值:GC对含量越高,Tm值越高
核酸的复性-DNA annealing/renaturation
定义:变性DNA在适当条件下,恢复形成双螺旋结构的现象,称为复性。
条件
变性的两条单链DNA能够相互碰撞
发生碰撞的两条单链DNA有互补序列
影响因素
温度(促进碰撞,太高导致变性)
DNA浓度
DNA序列复杂性
二级反应动力学,复性速率C0t1/2=1/k,取决于DNA序列的复杂性
核酸的杂交-hybridization
定义:具有互补配对碱基的任意两条单链DNA或者RNA之间形成稳定的双螺旋结构
southern blotting-电泳、印迹、杂交检测、显色,需要提纯操作
in situ hybridization-原位杂交,将细胞中的染色体展开,将DNA部分变性以产生能与探针杂交的单链区域。染色体被染色(以便看清并辨认不同的染色体)、杂交后,用X光片检测(定位与标记的探针杂交的基因)
fluorescence in situ hybridization-荧光原位杂交
添加了荧光抗体(荧光素标记抗体)检测二硝基苯酚(DNP)标记的DNA探针
第一章 发展史
概念:分子水平上解释生物学现象——分子水平上研究基因的结构和功能
遗传学和生物化学的交叉
发展史
区分标志:DNA双螺旋结构的提出
传递遗传学-奠基阶段
孟德尔遗传定律:遗传性状依靠独立的遗传因子传递,每个亲本只传递一半的遗传因子
摩尔根遗传的染色体理论:基因位于染色体上,奠定了分子遗传学的基础
分子遗传学-发展阶段
研究概况
还原论
个体-染色体-基因-DNA-核苷酸
整体论
基因组学、结构基因组学、功能基因组学
单基因水平向全基因组整体水平发展
研究内容
基因的结构
1869 Miescher分离核酸
kossel分离得到单核苷酸,1910诺贝尔奖
1953双螺旋
基因的功能
1944Avery-DNA是遗传物质
1958Meselson&Stahl细菌半保留复制
1902one-gene/one-enzyme hypothesis 尿黑酸症——大多数基因含有产生一条多肽链的信息
核糖体是非特异性的翻译机器,根据访问核糖体的mRNA的指令合成不同蛋白质
基因工程的兴起
相关生词
transposable element-转座因子
prion-阮病毒
programmed cell death(PCD)-程序性细胞凋亡
gene targeting-基因打靶