导图社区 分子生物学第三组基因与基因组
转录组是指一个活细胞所能转录出来的所有一mRNA。转录组学(transcriptomics)是一门在整体水平上研究细胞中基因转录的情况以及转录调控规律的学科。
编辑于2022-04-13 18:13:14基因与基因组
基因组
概念:是单倍体细胞的全套染色体或病毒粒子所含的全部 DNA分子或RNA分子。
C值(C value)是单倍体基因组的全部DNA含量,C值矛盾(C valueparadox)又称C值悖论是真核生物的C值与生物体复杂性之间对应关系的反常现象。
病毒基因组
DNA病毒基因组:例如腺病毒(adenovirus,Ad) 基因组
RNA病毒基因组:逆转录病毒基因组,例如人类免疫缺陷病毒(HIV)
原核生物基因组
细菌染色体基因组特点
1、细菌染色体基因组很小,仅由一条环状双链DNA分子组成 2、具有操纵子结构 大多为单括贝的,但也有多拷贝的 4、非编码DNA所占比例比真核细胞基因组小得多 5、具有编码同工酶的同源基因 6、一般没有重叠基因 7、具有多种调控区 8、在基因或操纵子的末端经常具有特殊的终子序列
染色体基因组:质粒。
真核生物基因组。
真核生物基因组的特点
重复序列
1、轻度重复序列(slightly repetitivesequence):在一个基因组内一般有2-10个拷贝。 2、中度重复序列(moderately repetitivesequence):在基因组中一般有10~数10万个拷贝。多数是分散重复序列,少数是串联重复序列 (1)卫星DNA (satellite DNA):由长串联的重复序列组成。 (2)小卫星DNA(minisatellite DNA):由中等大小(一般为15bp左右)的串联重复序列组 (3)微卫星DNA(microsatellite DNA):由2-5bp的重复单位组成。 3、高度重复序列(highly repetitivesequence):在基因组中重复频率高达106以上,复性速率很快的DNA序列。
细胞器基因组。
叶绿体基因组。
叶绿体也属于半自主性的细胞器,有自身的DNA,称为叶绿体DNA(chloroplast, ctDNA)。 (1)叶绿体基因组是闭合环状双链DNA分子。 (2)叶绿体基因组比较大,约为120-217kb,可编码50多种蛋白质及各种tRNA和rRNA (3)叶绿体DNA中的GC含量与核DNA和mtDNA有很大的不同 (4)叶绿体基因组的产物不能完全满足功能上的需要,必须有核基因产物的协同作用。
线粒体基因组。
线粒体是细胞的半自主性细胞器,有自身的DNA称为线粒体DNA(mitochondrial DNA,mtDNA)。 (1)每个线粒体都有多个DNA分子,所有的线粒体DNA都是闭合双链环状分子。 (2)不同种属的线粒体DNA大小不同 (3)线粒体基因组至少包括以下基因及基因族:rRNA基因、 tRNA基因、ATPase基因、 细胞色素COXase基因。 (4)线粒体基因组只能编码部分所需产物,还有一些物质需由核基因组与线粒体基因组共同互作产生。 (5)线粒体DNA可以用于分子系统发生研究
基因组学
比较基因组学
种间:共线性分析、系统发生的进化关系分析。
种内:种内比较基因组学:单核并酸多态性(SNP)、拷贝数多态(CNP)。
功能基因组学
转录组学
转录组是指一个活细胞所能转录出来的所有一mRNA。 转录组学(transcriptomics) 是一门在整体水平上研究细胞中基因转录的情况以及转录调控规律的学科。
蛋白组学
蛋白质组是指一个基因组所表达的全部蛋白质。蛋白质组学(proteomics) 是对蛋白质性质和功能研究的学科,通过对蛋白质的表达水平、翻译后修饰及与其他分子的相互作用的研究来明确蛋白质在细胞中的各种功能。
代谢组学
生物体的表型由 DNA、RNA、蛋白质及代谢物等各个层面调控决定,mRNA研究可以获得样本之间差异基因、复杂调控网络,而基因与表型不能直接关联,难以鉴定控制关键途径的结构及调控基因,结合代谢组,辅助时序表达的众多基因进行“共表达”分析,揭示基因功能,并将基因与表型关联起来,快速鉴定核心调控网络,确定关键候选基因。
生物信息学
生物信息学(bioinformatics) 是将大量系统的生物学数据与数学和计算机科学的分析理论和实用工具联系起来,通过对生物学实验数据的获取、加工、存储、检索与分析,解释这些数据所蕴含的生物学意义。
模式生物体基因组研究。
模式生物(model organism) 是指比较容易研究的生物,目前应用最广泛的模式生物包括:大肠杆菌、酿酒酵母、秀丽隐杆线虫、果蝇、稻瘋病菌、小鼠、拟南芥和水稻。模式生物体基因组研究就是利用模式生物作为模型,研究其基因的结构和生物学功能,并由此获得可以使用于其他比较难研究生物的信息,以揭示某种具有普遍规律的生命现象。
结构基因组学
基因组测序一代:Sanger双脱氧末端终止法和化学裂解法 二代:高通量测序技术 三代:单分子荧光测序技术(SMRT)和纳米孔单分子测序技术
遗传图谱(linkagemap)是通过遗传重组所得到的基因在具体染色体上的线性排列图。
遗传标记
一代
第一代DNA遗传标记是RFLP(限制性片 段长度多态性)和RAPD(随机扩增多态性 DNA)。
二代
第二代DNA遗传标记利用了存在于人类基因组中的大量重复序列,包括重复单位长度为15-65个核普酸左右的小卫星DNA,重复单位长度在2-6个核苟酸之间的微卫星DNA,后者又称为简短串联重复多态性,简称STRP。
三代
第三代DNA遗传标记,即单核昔酸多态 性,简称SNP标记,指的是分散于基因组中的 单个碱基的差异,包括单个碱基的缺失和插 入,但更常见的是单个核昔酸的替换。
物理图谱(physicalmap)是指有关构成基因组全部基因的排列和间距参数和信息。
全序列图谱
是分别将各染色体全部碱基序列绘制的图谱。包括转录序列和非转录序列。 目前的策略是把庞大的基因组分成若干有路标的区域后,进行测序分析。将测出的每一个DNA片段按其染色体位置进行准确的排列,从而得到人类基因组DIJA序列的全貌。
转录图谱
·是在人类基因组中鉴别出占据1-5%长度的全部结构基因的位置、结构与功能。 ·所有生物性状和疾病主要由蛋白质决定的,而所有蛋白质都是mRNA依照遗传密码编码的,若把mRNA通过反转录合成cDNA,就抓住了基因的转录部分。然后大规模测序,进行基因的分离、定位。 ·因此,转录图亦称CDNA图或“表达序列”图。
人类基因组计划
人类基因组计划人类基因组计划 (human genome project, HGP) 由美国科学家于1985年率先提出,1990年正式启动。美、英、法、德、日和中国科学家参与了这一计划。 2003年4月14日,国际人类基因组测序组宣布:人类基因组序列图—“完成图”提前绘制成功。
基因
概念:基因是负载遗传信息的RNA或者DNA片段,
历史演变
孟德尔:一个因子决定一种性状。1865 萨顿和鲍威尔:遗传物质和染色体。1903 约翰逊:提出了基因,代替了遗传因子。1909 摩尔根:功能单位,突变单位和交换单位。1926 Avery:证实了DNA是遗传物质。1944 美国本兹尔:提出顺反子概念:功能单位,决定一条多肽链的表达。1955 操纵子:基因表达调控单元(原核) 结构基因 调节基因 操纵基因
结构基因:编码蛋白质或RNA的基因,它的突变可能会导致蛋白质或RNA的一级结构发生改变(同义突变,异义突变)。 调节基因:其功能是产生调控蛋白,调控结构基因的表达。 操纵基因:其功能是与调控蛋白质结合,控制结构基因的表达。
类型
断裂基因
断裂基因:内部含间隔区,即由外显子和内含子互相间隔而组成的嵌合体。 发现:1977[美]Sharp Roberts 同时发现了断裂基因。通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现。
重叠基因
重叠基因:是指两个或两个以上的基因共有一段DNA序列。重叠基因的发现: 1977年,Sanger ΦX174DNA全长:5386核苷酸 编码的9种蛋白全长:2000个氨基酸; 3*2000=6000核苷酸
移动基因
移动基因(转座子) 指能够在一个DIA分子内部或两个DNA分子之间移动的DNA片段。在细菌中指在质粒和染色体之间或在质粒和质粒之间移动的DNA片段。转位也是DIA重组的一种形式。
假基因
假基因: 这是一种核普酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。 假基因常用符号ψ表示。 假基因与有功能的基因同源,原来也可能是有功能的基因,由于缺失(deletion) 或点突变(point mutaion)等,成为无功能的基因。
基因家族
基因家族:一组功能相似且核苔酸序列具有同源性 的基因,可能由某一共同祖先基因(ancestral gene)经 重复(duplication)和突变产生。