导图社区 基因组学与功能基因组学
这是一篇关于基因组学与功能基因组学的思维导图,其内容涵盖真核生物基因组的主要特点,人类基因计划与基因组学以及基因组测序与序列组装等内容
编辑于2022-06-05 21:46:21基因组学与功能基因组学
真核生物基因组主要特点
碱基数目庞大,结构复杂,基因组大部分位于细胞核中,一般由多条染色体组成。组蛋白+DNA→核小体→染色体。组蛋白上的氨基酸序列能够被进行各种修饰。
每条染色体的DNA分子具有多个复制起点,真核基因多为不连续基因(断裂基因)
断裂基因:真核生物基因的编码序列是不连续的,由内含子和外显子交替构成。
编码序列仅占基因组DNA的一小部分,绝大多数为非编码序列。
一般没有重叠基因,转录产物一般为单顺反子。
基因组中存在着大量的基因家族和奢侈基因。
基因组中存在大量的重复序列
表达调控比较复杂
C值悖理、N值悖理、DNA序列复杂度等
人类基因组计划与基因组学
人类基因组计划
人类基因组的工作草图已经在2000年6月26日胜利绘制完成,该工作草图包含人体90%以上碱基对的位置信息。
2001年2月12日,人类基因组图谱及初步分析结果公布,人类基因组由31.647亿个碱基对组成,有3万~3.5万个基因。
2003年4月15日,人类基因组序列图完成。研究者发现,人类基因组拥有的编码蛋白质的基因数目在2万~2.5万个之间。
人类基因组的结构特点
是第一个被测序的脊椎动物基因组,测序发现,人类的基因数量比原先预期的少得多,其中的外显子,也就是能够制造蛋白质的编码序列,只占总长度的约1.5%。
基因中内汉族的序列占基因组的24%,因此涉及与产生蛋白质有关的序列达到25%。
人类基因组DNA中重复序列占50%以上,主要分成五种类型:①转座子成分;②已加工假基因;③简单重复序列;④大片段重复;⑤串联重复。
模式生物基因组研究与宏基因组研究
基因组测序与序列组装
基因组测序策略
自上而下或由长到短作图策略
全基因组鸟枪法作图策略
基因组测序方法与组装
早在1954年就已经出现了关于早期测序技术的报导,即Whitfeld等用化学降解的方法测定多聚核糖核苷酸序列。1 9 7 7年Sanger等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法,标志着第一代测序技术的诞生。
新一代测序方法
此后在三十几年的发展中陆续产生了第二代,第三代测序技术技术正在向着高通量、低成本、长读取长度的方向发展。
454测序技术原理,采用一种与以前完全不同的测序方式,在文库制备、模板制备和测序三个方面取得了突破。
Solexa测序技术原理,利用“DNA簇”和“可逆性末端终结”技术,并利用单分子阵列进行自动化样本制备及基因组数百万个碱基进行大规模平行测序。
SOLiD测序技术原理,基于连接酶的测序法,即利用DNA连接酶在连接过程中边连接边测序。
单分子测序技术(第三代),SMRT技术的测序速度很快,利用这种技术测序速度可以达到每秒10个dNTP。
新一代测序方法的应用
基因组从头测序
基因组重测序
简化基因组测序
转录组测序
基因组图谱构建与应用
遗传标记
RFLP标记
RFLP全称为限制性片段长度多态性,是第一代DNA标记。
其原理为利用限制性内切酶消化基因组DNA,形成大小不等、数量不同的分子片段,经电泳分离,通过Southern印迹将DNA片段转移至支持膜(尼龙膜或硝酸纤维素膜)上,然后用放射性同位素(32P)或非同位素 (如地高辛,荧光素)标记的探针与支持膜上的DNA片段进行杂交。不同基因组DNA酶切位点的改变,会使得RFLP谱带表现出不同程度的多态性.
VNTRs标记
真核生物基因组DNA中含有大量的串联重复序列,在不同个体间或同一个体的同源染色体间都会产生高度的变异。
呈共显性遗传,符合孟德尔遗传传递规律,可用来进行遗传分析和作图。在基因组中有广泛的分布,可检出的多肽更丰富,出现的频率更高。
AFLP标记
Zabean等(1993)将PCR与RFLP结合起来,创造了AFLP分析技术。
基因组DNA先用限制性内切酶双酶切,再在两端连上特定的人工接头,根据接头和酶切位点的序列设计引物。一般在引物的3'端再增加1一3个碱基进行选择性扩增。不同样品由于DNA序列不同,扩增出的片段数及长度各不相同,经变性的聚丙烯酰胺电泳就能区分出不同样品之间的差异,作为遗传标记构建连锁图,或鉴定与特定性状连锁的标记。
与RFLP比较,它无需了解DNA模板序列,产生的多态性较多;与RAPD比较,它的可重复性得到极大提高。
RAPD标记
RAPD是Williams等人(1990)发展起来的一种新型遗传标记,尽管这一技术比较年轻,但由于其独特的检测DNA多态性的方式即极快速、简捷、高效等优点,使得RAPD技术已渗透于有关基因研究的各个领域。
RAPD是建立于PCR基础之上的,利用随机的脱氧核节酸序列作引物(一般9~10碱基对),对所研究的基因组DNA体外扩增,扩增产物经电泳分离染色后,来检测其多态性,这些扩增DNA片段多态性便反映了基因组相应区域的DNA多态性。
STS标记
是根据单拷贝的DNA片段两端的序列,设计一对特异引物,经PCR扩增基因组DNA而产生的一段长度为几百bp的特异序列。由于不同的STS序列在基因组中往往只出现一次,从而能够界定基因组的特意为点。
SNP标记
单核苷酸多态性标记是同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象
遗传图谱
人类基因组遗传图谱的构建
经典遗传图谱的构建
现代遗传学图谱的构建
植物基因组遗传图谱的构建
遗传标记的选择
亲本的选配
分离群体类型的选择与作图群体的构建
群体大小的确定
连续图谱制作的统计学方法
DNA标记分离数据的处理
物理图谱
物理图谱是指各遗传标记之间或DNA序列两点之间,以物理距离来表示其在DNA分子上的位置而构成的位置图,以实际的碱基对或千碱基对或百万碱基对长度来度量其物理距离。
物理图谱的构建
细胞遗传学图谱
限制性内切核酸酶图谱
叠连群图谱
全基因组序列图谱
基因组DNA大片段文库的构建
基因组图谱的应用
寻找新的基因
基因的克隆与分离
基因功能的预测
比较基因组学研究
基因定位
比较基因组学和功能基因组学
比较基因组学与进化
①比较基因组学是一门通过运用数理理论和相应计算机程序,对不同物种的基因组进行比较分析来研究基因组大小上与基因数量、基因排列顺序、编码序列与非编码序列的长度、数量及特征,以及物种进化关系等生物学问题的科学。最重要也是最能体现比较基因组学学科特点的是不同生物间全基因组的核苷酸序列的整体比较。②比较基因组学的重要作用之一是它能根据对一种生物相关基因的认识来理解、诠释甚至克隆分离另一种生物的基因。③目前,通过比较基因组学的研究所获得的重要进展主要表现在:(1)加深了人们对基因组结构和功能的认识;(2)揭示了近缘物种中存在保守的连锁群或染色体“板块”结构;(3)进一步理解基因组的进化。同时促进了“系统生物学”和“单细胞基因组学”的形成和发展。
功能基因组学
随着多种生物全基因组序列的获得,基因组研究正在从结构基因组学转向功能基因组学的整体研究。在功能基因组学的研究中通常运用高通量技术,如DNA微阵列, 反求遗传学技术如基因打靶、转基因、反义mRNA、RNA 干扰,以及新一代基因编辑技术CRISPR-Cas9等技术来系统地分析基因功能及基因间相互作用、基因组的时空表达以及发现和寻找新基因等。
蛋白质组学
蛋白质组学是研究细胞内全部蛋白质的组成结构与功能的科学。蛋白质组是指由一个基因组所表达的全部相应蛋白质。因此,蛋白质组与基因组相对应,也是一个整体的概念,是基因组表达的全部蛋白质。②蛋白质组学是蛋白质组概念的延伸,是在整体上研究细胞内蛋白质组的结构与功能及其活动规律的科学,包括分析全部蛋白质组所有组成成分及它们的数量,确定各种组分所在的空间位置、修饰方法、互作机制、生物活性和特定功能等。与传统对单一蛋白研究相比,蛋白质组学研究所采用的是高通量和大规模的研究手段。③蛋白质组分析技术有多种选择,质谱分析以其快速、准确、灵敏而成为蛋白质组的主要鉴定分析技。④蛋白质组研究中最重要的一个方面是数据库的建立,包括蛋白质序列数据库、质谱数据库、双向电泳数据库等。
代谢组学
①代谢组是指某一生物的细胞、组织或器官在某一特定生理时期内所有代谢物的集合。这些代谢产物,包括一系列不同生物化学结构分子,例如肽、糖类、脂质核酸以及异源物质的催化产物等,也包括一些参与生物体新陈代谢、维持生物体正常生长功能和生长发育的内源性小分子化合物(其相对分子质量M≤1000)。 ②代谢组学的概念于1997年和1999年,分别由Oliver等和 Nicholson等首先提出,是指研究某一生物或细胞,在一特定生理时期内其代谢组的变化,即对所有低相对分子质量代谢产物同时进行定性和定量分析的一门新科学。 ③代谢组学研究流程包括样品制备、代谢产物分离、检测与鉴定以及数据分析与模型建立三个部分,以高通量的检测实验和大规模的计算为特征。 ④代谢组学在医学研究中的特点表现在于:关注内源性化合物;对生物体系的小分子化合物进行定量定性研究;上述化合物的上调和下调指示了与疾病,毒性、基因修饰或环境因子的影响;这些内源性化合物的知识可以被用于疾病的诊断和药物筛选。
生物信息学与功能基因组学
生物信息学是运用计算机技术和信息技术开发新的算法和统计方法,对生物实验数据进行分析,确定数据所含有的生物学意义,并开发新的数据分析工具以实现对各种信息的获取和管理的科学。生物信息学产生于20世纪80年代,它是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。以核磁共振为主。在完成基因组图谱构建以及全部序列测定的基础上继基因组学后产生的功能基因组学、蛋白质组学、转录组学、代谢组学,以及其他旨在全基因组水平研究基因功能、相互关系及调控机制为主要内容,统称为后基因组学。
基因组学研究新进展及应用
全基因组关联研究
全基因组关联研究是用来寻找基因变异与表型之间关系的一种遗传学研究方法。进行GWAS的前提条件是:所研究物种的基因组测序工作已完成、基于序列变异SNP单体型图谱构建和有效的高通量基因分型技术。
千人基因组计划
是一个国际合作人类基因组测序计划。其目的是将测定选自全世界各地27个群体总计2500人的全基因组 DNA序列,绘制迄今为止最详尽的、最有医学应用价值的人类基因组遗传多态性图谱。
1000中动植物基因组计划
中国深圳华大基因研究院于2010年启动“1000种动植物基因组计划”。该计划在近几年内为1000种重要动植物进行基因组测序,将为被测序物种的各种研究提供可靠的基础,比如同一物种各种品系的基因组学研究、表观基因组学和转录组学研究等。