导图社区 分子生物学第二章基因、基因组与基因组学
基础医学分子生物学,希望能帮助到人
编辑于2020-10-14 09:58:37基因
基因的结构和功能
基因
基因的分子生物学概念:合成有功能的蛋白质或RNA所必需的全部DNA (除部分RNA病毒外),即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列
基因组
指含有一种生物的全套遗传信息的遗传物质
等位基因
位于同源染色体的同一位置的相对基因
基因发展
1909丹麦生物学家W. Johannsen用“基因”一词代替了1886年Mendel在《植物杂交实验》用的“遗传因子”;1926Morgan发表了《基因论》,指出基因在染色体上
结构基因
基因中编码RNA或蛋白质的DNA序列,又称编码区
非结构基因
结构基因两侧的一段不编码的DNA片段,参与基因表达调控,又称侧翼序列,调节区或非编码区
顺式作用元件
顺式作用元件(cis-acting element): 能影响基因表达,但不编码RNA或多肽链的DNA序列,如启动子、增强子、沉默子、polyA加尾信号区及反应元件等
反式作用元件
转录因子
开放阅读框ORF
在DNA链上,由蛋白质合成的起始密码子开始,到终止密码子为止的一个连续编码序列
非编码区UTR
(5’端前导区和3’端尾部区)
起始密码子
AUU,AUG,AUA
终止密码子
AGG,AGA,UGA,UAA,UAG
基因组的结构和功能
基因组
提出
1920年Winkles将GENes和chromos OMEs组合而来
定义
细胞或生物体中一套完整单倍体的遗传物质的总和
人类基因组包含24条染色体(22条常染色体和2条性染色体)及线粒体上的遗传物质
特点
不同生物体的基因组大小和复杂程度各不相同
病毒、原核生物及真核生物所储存的遗传信息量有着巨大的差别,其基因组的结构和组织形式也有着巨大的差异
原核生物基因组
操纵子
指数个功能上相关联的结构基因串联在一起,构成信息区,连同其上游的调控区(包括启动子和操纵基因)及下游的转录终止信号所构成的基因表达单位,所转录的RNA为多顺反子
启动子是RNA聚合酶结合的区域
操纵基因实际上不是一个基因,而是一段能被特异阻遏蛋白识别和结合的DNA序列
多顺反子
原核生物的一个mRNA分子带有几个结构基因的遗传信息
转位因子
能够在一个分子内部或两个DNA分子之间移动的DNA片段
分类
插入序列,转座子,可转座的噬菌体
真核原核都有
质粒
定义
是独立于许多细菌及某些真核细胞(如酵母等)染色体外共价闭合环状DNA分子,是能独立复制的最小遗传单位
按功能分类
F质粒
性质粒(F质粒),即含F质粒的细菌(标记为F+)与不含F质粒的细菌(F-)混合,其结果是F+菌将其质粒DNA转到F-宿主细胞,使后者变成F+。
R质粒
耐药性质粒(R质粒)带有耐药基因,可以使宿主菌获得耐受相应抗生素的能力
Col质粒
大肠杆菌素质粒(Col质粒)能使大肠杆菌合成大肠杆菌素,后者可以杀死不含大肠杆菌素质粒的亲缘细菌
按复制机制分类
严紧型质粒
受寄主细胞严格控制,每个细胞仅含一个或几个拷贝
松弛型质粒
复制不受寄主细胞严格控制,每个细胞可含10~200个拷贝
质粒的特性
能在细胞内自主复制
质粒的不相容性
具有相同复制系统的质粒不能共存于同一个细胞内
质粒的转移性
有些质粒可以通过细菌接合作用在细菌细胞间传递
结构
1.基因组由一条环状双链DNA组成; 2.只有一个复制起始点; 3.大多数结构基因组成操纵子结构; 4.结构基因无重叠现象; 5.基因密度非常高,基因组中编码区大于非编码区; 6.重复基因少,结构基因一般为单拷贝; 7.有编码同工酶的等基因; 8.基因组中存在可移动的DNA序列; 9.非编码区主要是调控序列。
真核生物基因组
一般特点
基因组庞大,人类细胞中含有的基因总数大概有3万个
结构特点
1.每一种真核生物都有一定的染色体数目; 2.远大于原核基因组,结构复杂,基因数庞大; 3.真核生物基因转录产物为单顺反子; 4.有大量重复序列; 5.真核基因多为断裂基因; 6.非编码序列多于编码序列; 7.功能相关基因构成各种基因家族
单顺反子
即一个结构基因转录、翻译成一个mRNA分子,一条多肽链
真核细胞基因组功能特点(老师上课PPT上没有)
高度重复序列
反向重复序列
复性速率极快,即使在极低的DNA浓度下也能很快复性,因此又称为零时复性部分 没有间隔的反向重复称为回文结构
卫星DNA
可以用等密度梯度离心法将其与主体DNA分开,也称为随体DNA
高度重复序列的功能
参与复制水平的调节
参与基因表达的调控
参与转位作用
与进化有关
同一种属中不同个体的高度重复序列的重复次数不同,DNA指纹
α卫星DNA成簇地分布在染色体附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能有赖于具有染色体专一性的特定卫星DNA序列
中度重复序列
短分散片段
短分散片段(short interspersed repeated segment): 这类重复序列的平均长度约为300bp (<500bp),它们与平均长度约为1000bp的单拷贝序列间隔排列。拷贝数可达10万次左右如Alu家族、Hinf家族等属于这种类型的中度重复序列
举例
Alu家族,Hinf家族,多聚dT-dG家族
长分散片段
长分散片段(long interspersed repeated segment):这类重复序列的长度大于1000bp,平均长度为3500~5000bp,它们与平均长度为13 000b (个别长几万bp)的单拷贝序列间隔排列,)有的实验显示,人类基因组中所有长分散片段之间的平均距离为2.2kb拷贝数一般在1万左右,如Kpn 1家族等。中度重复序列在基因组中所占的比例在不同种属之间差异很大,一般占10%~40%,在人类中约占12%。这些序列大多不编码蛋白质。
举例
Kpn I 家族
特点
中度重复序列一般具有种特异性,在适当的情况下,可以用它们作探针区分不同种哺乳类动物细胞的DNA
单拷贝序列
定义
单拷贝序列在单倍体基因组中只出现一次或数次,因而复性速率很慢
含量
50%~80%
功能
只有一小部分用来编码蛋白质,其他部分的功能尚不清楚
多基因家族与假基因
多基因家族
指某个祖先基因经过重复和变异所产生的一组基因
多基因家族种类
基因家族成簇分布在同一条染色体上
一个基因家族的不同成员成簇分布在不同染色体上
假基因
在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因
真核细胞和原核细胞的基因组比较
真核基因组比原核基因组大得多
真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,细胞核外还有遗传成分(如线粒体DNA等)
真核生物基因组是二倍体或多倍体,而原核生物基因组基本上是单倍体
细菌转录出多顺反子mRNA,真核生物是一个结构基因转录生成一条mRNA,基本上没有操纵子结构
原核生物基因组大部分序列是编码基因
原核生物中蛋白质编码基因的序列大多数是连续的,而真核生物编码蛋白质的基因绝大多数是不连续的,转录后需经剪接成为成熟mRNA,才能翻译成蛋白质
原核生物基因组中除rRNA,tRNA基因有多个拷贝外,重复序列不多
基因组学
发展
1986年美国科学家Thomas Roderick提出基因组学(genomics)的概念
定义
是指对所有基因组作图(包括遗传图谱、物理图谱、转录图谱)、核苷酸序列分析、基因定位和结构基因功能分析的一门学科
研究内容
结构基因组学
遗传图谱
物理图谱
转录图谱
功能基因组学
利用结构基因组所提供的信息,发展和应用新的实验手段,通过在基因组水平上系统、全面分析基因的功能,使生物学研究从对单一基因或蛋白质同时进行系统的研究
比较基因组学
在基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,以了解基因的功能、表达机制和物种进化的学科
人类基因组计划
研究目标
阐明构成人类的全部DNA的结构;阐明基因的编码方式和分布特点;理解基因及其调控序列之间的相互关系;理解DNA全部序列所蕴藏的意义
研究内容
完成遗传图谱、物理图谱、序列图谱、转录图谱分析
线粒体基因组的结构特点
特点
能自主复制 在细胞内具有多拷贝 主要编码与氧化磷酸化相关的酶 无内含子 基因排列紧密,无间隔 有少数重叠
特性
2个rRNA基因,22个tRNA基因,13个编码蛋白质基因编码序列占93%
病毒基因组
课本上
(1)病毒基因组大小相差较大,与细菌和真核细胞相比,病毒的基因组很小(乙肝病毒基因组只有3kb,所含信息量较小,只能编码四种蛋白质;痘病毒基因组300kb,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚至为核苷酸代谢的酶类编码) (2)病毒基因组可以由DNA组成,也可以由RNA组成,但两者不共存于同一个病毒中 (3)基因有连续的和间断的 (4)有的RNA病毒基因由不连续的RNA链组成(目前还没有发现有节段性的DNA分子构成的病毒基因组) (5)病毒基因组的功能单位或转录单位可被转录成为多顺反子mRNA,然后再加工成各种成熟的mRNA,作为翻译蛋白质的模板 (6)基因重叠(即同一段DNA片段能够以两种或两种以上的阅读方式进行阅读,因而可以编码2种或2种以上多肽) (7)病毒基因组用来编码蛋白质 (8)相关基因丛集 (9)有的基因有内含子
反转录病毒
RNA病毒
能够携带或编码合成反转录酶RT
二倍体病毒,其他病毒通常为单倍体基因组
(1)编码区:所有反转录病毒基因组都含有3个基本的结构基因-gag、pol和env。 gag基因编码病毒衣壳蛋白; pol基因编码肽链内切酶、一个反转录酶和一个前病毒整合相关的酶; env基因编码包膜蛋白。 (2)非编码区:除了上述编码区外,反转录病毒基因组还有非编码区,主要与基因组复制和基因表达有关。