导图社区 027组学与系统生物医学
生物化学与分子生物学
编辑于2022-11-02 11:57:31 广东组学与系统生物医学
概述
21世纪以来,生命科学进入了空前的“大数据 big data”时代。生命科学研究模式亦正在发生重大转变,其主要标志就是生命科学正从“微观(实验科学)向“宏观”(整合生物科学)的方向发展。
生物遗传信息的传递具有方向性和整体性。
组学是基于组群或集合的认识论,注重事物和过程之间的相互联系,即整体性。
生物信息学的发展为组学研究提供了重要方法。
系统生物医学则是在各种组学的基础上应用系统生物学原理与方法研究疾病发生发展规律和机制,发展现代高效的预测、预防、诊断和治疗手段。
系统生物医学的发展必将驱动新一轮医学科学革命。
按照遗传信息传递的方向性,可将组学按基因组学、转录物组学、蛋白质组学、代谢组学等层次加以叙述。
第一节基因组学
概述
基因组( genome)
概念
基因组是基因(gene)和染色体( chromosome)两个名词的组合,指的是一个生命单元所拥有的全部遗传物质(包括核内和核外遗传信息),其本质就是DNA/RNA。
基因组学(genomics)是阐明整个基因组结构、结构与功能关系以及基因之间相互作用的科学。
近年来,在基因组水平上研究不改变基因组序列而通过表观遗传修饰调控基因或基因组表达的表观基因组学( epigenomics)成为研究热点。
根据研究目的不同而分为
结构基因组学( structural genomics)
结构基因组学通过基因组作图和序列测定,揭示基因组全部DNA序列及其组成;
功能基因组学( functional genomics)
比较基因组学通过模式生物基因组之间或模式生物与人类基因组之间的比较与鉴定,发现同源基因或差异基因,为研究生物进化提供依据;
比较基因组学( comparative genomics)
功能基因组学则利用结构基因组学所提供的信息,分析和鉴定基因组中所有基因(包括编码和非编码序列)的功能。
一、结构基因组学揭示基因组序列信息
概述
结构基因组学主要通过人类基因组计划( human genome project,HGP)的实施,解析人类自身DNA的序列和结构。
研究内容就是通过基因组作图和大规模序列测定等方法,构建人类基因组图谱
遗传图谱( genetic map)
物理图谱(physical map)
序列图谱( sequence map)
转录图谱(transcription map)
(一)通过遗传作图和物理作图绘制人类基因组草图
概述
作图
人染色体DNA很长,不能直接进行测序,必须先将基因组DNA进行分解、标记,使之成为可操作的较小结构区域,这一过程称为作图。
HGP实施过程采用了遗传作图和物理作图的策略。
1.遗传作图就是绘制连锁图
遗传图谱又称连锁图谱( linkage map)。
遗传作图(genetic mapping)
概念
遗传作图就是确定连锁的遗传标志( genetic marker;或分子标志, molecular marker)位点在一条染色体上的排列顺序以及它们之间的相对遗传距离。
用厘摩尔根( centi-Morgan,cM)表示,当两个遗传标记之间的重组值为1%时,图距即为1cM(约为1000kb)。
常用的遗传标志有
限制性片段长度多态性(re-striction fragment length polymorphism,RFLP)
可变数目串联重复序列( variable number of tandem repeat,VNTR)
单核苷酸多态性( single nucleotidepolymorphism,SNP)
SNP的精确度最高(0.5~1.0kb)
2.物理作图就是描绘杂交图、限制性酶切图及克隆系图
物理作图( physical mapping)
概念
物理作图以物理尺度(bp或kb)标示遗传标志在染色体上的实际位置和它们间的距离,是在遗传作图基础上绘制的更为详细的基因组图谱。
物理作图包括
荧光原位杂交图( fluorescent in situ hybridization map, FISH map;将荧光标记探针与染色体杂交确定分子标记所在的位置)
限制性酶切图( restriction map将限制性切位点标定在DNA分子的相对位置)
克隆重叠群图( clone contig map
它是在采用酶切位点稀有的限制性内切酶或高频超声破碎技术将DNA分解成大片段后,再通过构建酵母人工染色体( yeast artificial chromosome,YAC)或细菌人工染色体(bacterial artificial chromosome,BAC),获取含已知基因组序列标签位点( sequence tagged site,STS)的DNA大片段。
最重要的一种物理作图
STS是指在染色体上定位明确、并且可用PCR扩增的单拷贝序列,每隔100kb距离就有一个标志。
在STS基础上构建覆盖每条染色体的大片段DNA连续克隆系就可绘制精细物理图。
可以说,通过克隆重叠群作图就可以知晓特异DNA大片段在特异染色体上的定位,这就为大规模DNA测序做好了准备。
(二)通过EST文库绘制转录图谱
人类基因组DNA中只有约2%的序列为蛋白质编码序列,对于一个特定的个体来讲,其体内所有类型的细胞均含有同样的一套基因组。 但成年个体每一特定组织中,细胞内一般只有10%的基因是表达的;即使是同一种细胞,在其发育的不同阶段,基因表达谱亦是不一样的。 因此,了解每一组织细胞及其在不同发育阶段、不同生理和病理情况下mRNA转录情况,可以帮助我们了解不同状态下细胞基因表达情况,推断基因的生物学功能。
转录图谱
概念
转录图谱又称为cDNA图或表达图( expression map),是一种以表达序列标签( expressed sequencetag,EST)为位标绘制的分子遗传图谱。
EST
通过从cDNA文库中随机挑取的克隆进行测序所获得的部分cDNA的5’-或3’-端序列称为EST。
一般长300~500bp右
将mRNA逆转录合成的cDNA片段作为探针与基因组DNA进行分子杂交,标记转录基因,就可以绘制出可表达基因的转录图谱。
(三)通过BAC克隆系和鸟枪法测序等构建序列图谱
在基因作图的基础上,通过BAC克隆系的构建和鸟枪法测序( shotgun sequencing),就可完成全基因组的测序工作,再通过生物信息学手段,即可构建基因组的序列图谱。
BAC载体是一种装载较大片段DNA的克隆载体系统用于基因组文库构建。
基因组组装
全基因组鸟枪法测序是直接将整个基因组打成不同大小的DNA片段,构建BAC文库,然后对文库进行随机测序,最后运用生物信息学方法将测序片段拼接成全基因组序列,此称为基因组组装( genome assem-bly)
二、比较基因组学鉴别基因组的相似性和差异性
概述
比较基因组学是在基因组序列的基础上,通过与已知生物基因组的比较,鉴别基因组的相似性和差异性
一方面可为阐明物种进化关系提供依据
另一方面可根据基因的同源性预测相关基因的功能
比较基因组学可在物种间和物种内进行
物种间称为种间比较基因组学
物种内则称为种内比较基因组学
两者均采可用 BLAST等序列比对工具
(一)种间比较基因组学阐明物种间基因组结构的异同
种间比较基因组学通过比较不同亲缘关系物种的基因组序列,可以鉴别出编码序列、非编码(调控)序列及特定物种独有的基因序列。
而对基因组序列的比对,可以了解不同物种在基因构成、基因顺序和核苷酸组成等方面的异同,从而用于基因定位和基因功能的预测,并为阐明生物系统发生进化关系提供数据。
(二)种内比较基因组学阐明群体内基因组结构的变异和多态性
同种群体内各个个体基因组存在大量的变异和多态性,这种基因组序列的差异构成了不同个体与群体对疾病的易感性和对药物、环境因素等不同反应的分子遗传学基础。
例如,SNP最大限度地代表了不同个体之间的遗传差异,鉴别个体间SNP差异可揭示不同个体的疾病易感性和对药物的反应性,有利于判定不同人群对疾病的易感程度并指导个体化用药。
三、功能基因组学系统探讨基因的活动规律
概述
功能基因组学的主要研究内容包括
基因组的表达
基因组功能注释
基因组表达调控网络及机制的研究
功能基因组学从整体水平上研究一种组织或细胞在同一时间或同一条件下所表达基因的种类、数量、功能,或同一细胞在不同状态下基因表达的差异。
它可以同时对多个表达基因或蛋白质进行研究,使得生物学研究从以往的单一基因或单一蛋白质分子研究转向多个基因或蛋白质的系统研究。
(一)通过全基因组扫描鉴定DNA序列中的基因
这项工作以基因组DNA序列数据库为基础,加工和注释人类基因组的DNA序列,进行新基因预测、蛋白质功能预测及疾病基因的发现。
主要采用计算机技术进行全基因组扫描,鉴定内含子与外显子之间的衔接,寻找全长可读框( open reading frame,ORF),确定多肽链编码序列。
(二)通过BLAST等程序搜索同源基因
同源基因在进化过程中来自共同的祖先,因此通过核苷酸或氨基酸序列的同源性比较,就可以推测基因组内相似基因的功能。
这种同源搜索涉及序列比较分析,NCBI的 BLAST程序是基因同源性搜索和比对的有效工具。 每一个基因在 GenBank中都有一个序列访问号 (accession number),在 BLAST界面上输入2条或多条访问号,就可实现一对或多对序列的比对。
(三)通过实验验证基因功能
可设计一系列的实验来验证基因的功能,包括转基因、基因过表达、基因敲除、基因敲减或基因沉默等方法,结合所观察到的表型变化即可验证基因功能。
由于生命活动的重要功能基因在进化上是保守的,因此可以采用合适的模式生物进行实验。
(四)通过转录物组和蛋白质组描述基因表达模式
基因的表达包括转录和翻译过程,研究基因的表达模式及调控可借助转录物组学和蛋白质组学相关技术与方法(见本章第二、三节)进行。
四、 ENCODE计划旨在识别人类基因组所有功能元件
HGP提供了人类基因组的序列信息(符号),并定位了大部分蛋白质编码基因。 如何解密这些符号代表的意义,特别是还有98%左右的非蛋白质编码序列的功能,仍然是一项十分繁重的任务。
(一)ENCODE计划是HGP的延续与深入
若要全面理解生命体的复杂性,必须全面确定基因组中各个功能元件及其作用。
在此背景下,美国于2003年9月启动了DNA元件百科全书( ENCODE)计划。
目标
识别人类基因组的所有功能元件,包括蛋白质编码基因、各类RNA编码序列、转录调控元件以及介导染色体结构和动力学的元件等,当然还包括有待明确的其他类型的功能性序列(图27-3),
目的
完成人类基因组中所有功能元件的注释,帮助我们更精确地理解人类的生命过程和疾病的发生、发展机制。
(二) ENCODE计划已取得重要阶段性成果
根据 ENCODE计划联盟有关1640组覆盖整个人类基因组的数据分析报告认为
人类基因组的大部分序列(80.4%)具有各种类型的功能,而并非之前认为的大部分是“垃圾”DNA;
人类基因组中有399 124个区域具有增强子样特征,70 292个区域具有启动子样特征;
非编码功能元件富含与疾病相关的SNP,大部分疾病的表型与转录因子相关。
这些发现有助于深入理解基因表达调控的规律,并发现和鉴定出一大批与疾病相关的遗传学风险因子。
第二节转录物组学
概述
转录物组( transcriptome)
概念
转录物组指生命单元所能转录出来的全部转录本,包括mRNA、rRNA、tRNA和其他非编码RNA。
转录物组学( transcriptomics)是在整体水平上研究细胞编码基因(编码RNA和蛋白质)转录产生的全部转录物的种类、结构和功能及其相互作用的科学。
与基因组相比,转录物组最大的特点是受到内外多种因素的调节,因而是动态可变的。
这同时也决定了它最大的魅力在于揭示不同物种、不同个体、不同细胞、不同发育阶段和不同生理病理状态下的基因差异表达的信息。
一、转录物组学全面分析基因表达谱
转录物组学全面分析基因表达谱转录物组学是基因组功能研究的一个重要部分,它上承基因组,下接蛋白质组。
其主要内容为大规模基因表达谱分析和功能注释。
大规模表达谱或全景式表达谱是生物体(组织、细胞)在某一状态下基因表达的整体状况。
长期以来,基因功能的研究通常采用基因的差异表达方法,效率低,无法满足大规模功能基因组研究的需要。 利用近年来建立起来整体性基因表达分析如微阵列(或芯片)、表达系列分析和大规模平行信号测序系统等技术,可以同时监控成千上万个基因在不同状态(如生理、病理、发育不同时期、诱导刺激等)下的表达变化,从而推断基因间的相互作用,揭示基因与疾病发生、发展的内在关系。
二、转录物组研究采用整体性分析技术
概述
基因表达谱
任何一种细胞在特定条件下所表达的基因种类和数量都有特定的模式称为基因表达谱。
它决定着细胞的生物学行为
转录物组学就是要阐明生物体或细胞在特定生理或病理状态下表达的所有种类的RNA及其功能。
微阵列(microarray)、基因表达系列分析(serial analysis of gene expression,SAGE)和大规模平行信号测序( massively parallel signature sequencing,MPSS)等技术可用于大规模转录物组研究。
(一)微阵列是大规模基因组表达谱研究的主要技术
微阵列或DNA芯片(见第二十四章)可以同时测定成千上万个基因的转录活性,至可以对整基因组的基因表达进行对比分析,因而成为基因组表达谱研究的主要技术。
(二)SAGE在转录物水平研究细胞或组织基因表达模式
SAGE的基本原理是用来自cDNA3’-端特定位置9~10bp长度的序列所含有的足够信息鉴定基因组中的所有基因。
可利用锚定酶( anchoring enzyme,AE)和位标酶( tagging enzyme,TE)这两种限制性内切酶切割DNA分子的特定位置(靠近3’-端),分离SAGE标签,并将这些标签串联起来,然后对其进行测序。
这种方法可以全面提供生物体基因表达谱信息。它还可用来定量比较不同状态下组织或细胞的所有差异表达基因。
(三)MPSS是以序列测定为基础的高通量基因表达谱分析技术
MPSS的原理是采用能够特异识别每个转录子信息的序列信号( sequence signature,16~20bp)来定量地大规模平行测定相应转录子的表达水平。
也就是将mRNA一端测出的一个包含10~20bp的特异序列信号用作检测指标,每一序列信号在样品中的频率(拷贝数)就代表了与该序列信号相应的基因表达水平。
MPSS所测定的基因表达水平是以计算mRNA拷贝数为基础的,是一个数字表达系统。
只要将目的样品和对照样品分别进行测定,通过严格的统计检验,就能测定表达水平较低、差异较小的基因,而且不必预先知道基因的序列。
三、转录物组测序和单细胞转录物组分析是转录物组学的核心任务
目前,转录物组学的核心任务侧重于大规模转录物组测序和单细胞转录物组分析两个方面。
(一)高通量转录物组测序是获得基因表达调控信息的基础
转录物组测序即RNA测序,其研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA。
基于高通量测序平台的RNA-seq技术能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和低丰度转录本,发现基因融合,识别可变剪切位点和SNP提供全面的转录物组信息。
(二)单细胞转录物组有助于解析单个细胞行为的分子基础
不同类型的细胞具有不同的转录物组表型,并决定细胞的最终命运。
从理论上讲,转录物组分析应该以单细胞为研究模型,这样有助于解析单个细胞的行为、机制以及与机体的关系等的分子基础。
优点
单细胞测序可解决用全组织样本测序无法解决的细胞异质性问题,尤其适用于存在高度异质性的干细胞及胚胎发育早期的细胞群体。
与活细胞成像系统相结合,单细胞转录物组分析更有助于深入理解细胞分化、细胞重编程及转分化等过程以及相关的基因调节网络。
单细胞转录物组分析在临床上可以连续追踪疾病基因表达的动态变化,监测病程变化、预测疾病预后。
第三节蛋白质组学
概述
蛋白质是生物功能的主要载体。
蛋白质组( proteome)
概念
蛋白质组是指细胞、组织或机体在特定时间和空间上表达的所有蛋白质。
蛋白质组学( proteomics)
概念
蛋白质组学( proteomics)以所有这些蛋白质为研究对象,分析细胞内动态变化的蛋白质组成、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,并在整体水平上阐明蛋白质调控的活动规律。
故又称为全景式蛋白质表达谱(global protein expression profile)分析
一、蛋白质组学研究细胞内所有蛋白质的组成及其活动规律
概述
蛋白质组学的研究主要涉及两个方面
一是蛋白质组表达模式的研究,即结构蛋白质组学( struc tural proteomics);
二是蛋白质组功能模式的研究,即功能蛋白质组学( functional proteomics)。
蛋白质的种类和数量总是处在一个新陈代谢的动态过程中
同一细胞的不同周期,其所表达的蛋白质是不同的;
同一细胞在不同的生长条件(正常疾病或外界环境刺激)下,所表达的蛋白质也是不同的。
这些动态变化增加了蛋白质组研究的复杂性。
(一)蛋白质鉴定是蛋白质组学的基本任务
1.蛋白质种类和结构鉴定是蛋白质组研究的基础
细胞在特定状态下表达的所有蛋白质都是蛋白质组学的研究对象。
一般利用二维电泳和多维色谱并结合生物质谱、蛋白质印迹、蛋白质芯片等技术,对蛋白质进行全面的种类和结构鉴定研究。
2.翻译后修饰的鉴定有助于蛋白质功能的阐明
很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化、糖基化等过程。
翻译后修饰是蛋白质功能调控的重要方式,因此,研究蛋白质翻译后修饰对阐明蛋白质的功能具有重要意义。
(二)蛋白质功能确定是蛋白质组学的根本目的
1.各种蛋白质均需要鉴定其基本功能特性
蛋白质功能研究包括
蛋白质定位研究
基因过表达/基因敲除(减)技术分析蛋白质活性
主要方向
分析酶活性和确定酶底物
细胞因子的生物学作用分析
配体受体结合分析
2.蛋白质相互作用研究是认识蛋白质功能的重要内容
细胞中的各种蛋白质分子往往形成蛋白质复合物共同执行各种生命活动。
蛋白质-蛋白质相互作用是维持细胞生命活动的基本方式。
要深入研究所有蛋白质的功能,理解生命活动的本质,就必须对蛋白质-蛋白质相互作用有一个清晰的了解,包括受体与配体的结合、信号转导分子间的相互作用及其机制等。
目前研究蛋白质相互作用常用的方法有酵母双杂交、亲和层析、免疫共沉淀、蛋白质交联、荧光共振能量转移等(见第二十四章)。
二、二维电泳、液相分离和质谱是蛋白质组研究的常用技术
概述
目前常用的蛋白质组研究主要有两条技术路线
基于双向凝胶电泳(two-dimensional gel elec- trophoresis,2-DE)分离为核心的研究路线
混合蛋白质首先通过2-DE分离,然后进行胶内酶解,再用质谱( mass spectroscopy,MS)进行鉴定;
基于液相色谱( liquid chromatography,LC)分离为核心的技术路线
混合蛋白质先进行酶解,经色谱或多维色谱分离后,对肽段进行串联质谱分析以实现蛋白质的鉴定。
质谱是研究路线中不可缺少的技术
(一)2-de-MALDI---S根据等电点和分子量分离鉴定蛋白质
1.2-DE是分离蛋白质的有效方法
2-DE是分离蛋白质最基本的方法
原理
蛋白质在高压电场作用下先进行等电聚焦( isoelectric focusing,IEF)电泳,利用蛋白质分子的等电点不同使蛋白质得以分离;
随后进行SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE),使依据等电点分离的蛋白质再按分子量大小进行再次分离。
目前2-DE的分辨率可达到10000个蛋白质点。
2. MALDI-MS鉴定2-DE胶内蛋白质点
MS是通过测定样品离子的质荷比(m/z)来进行成分和结构分析的方法。
2-DE胶内蛋白质点的鉴定常采用基质辅助激光解吸附离子化(MALDI)技术。
MALDI作为一种离子源,通常用飞行时间( time of flight,TOF)作为质量分析器,所构成的仪器称为MALDI-TOF –MS。
MALDI的基本原理
将样品与小分子基质混合共结晶,当用不同波长的激光照射晶体时,基质分子所吸收能量转移至样品分子,形成带电离子并进入MS进行分析,飞行时间与(m/z)1/2成正比。
MALDI-TOF -MS适合微量样品(fmol~amol)的分析。
利用质谱技术鉴定蛋白质主要通过两种方法
肽质量指纹图谱( peptide massfingerprinting,PMF)和数据库搜索匹配。
蛋白质经过酶解成肽段后,获得所有肽段的分子质量,形成一个特异的PMF图谱,通过数据库搜索与比对,便可确定待分析蛋白质分子的性质。
肽段串联质谱(MS/MS)的信息与数据库搜索匹配。
通过MS技术获得蛋白质一段或数段多肽的MS/MS信息(氨基酸序列)并通过数据库检索来鉴定该蛋白质。 混合蛋白质酶解后的多肽混合物直接通过(多维)液相色谱分离,然后进入MS进行分析。 质谱仪通过选择多个肽段离子进行MS/MS分析,获得有关序列的信息,并通过数据库搜索匹配进行鉴定。
(二)Lc-ES-MS通过液相层析技术分离鉴定蛋白质
概述
基于LC-ESI-MS的蛋白质组研究技术通常称之为鸟枪法( shotgun)策略。
其特点是组合多种蛋白质或肽段分离手段,首选不同的层析技术,现蛋白质或多肽的高效分离,并与MS/MS技术结合,实现多肽序列的准确鉴定。
1.层析分离肽混合物
从组织中提取的目标蛋白质混合物首先进行选择性酶解,获得肽段混合物,然后进行二维液相分离。
一维液相分离一般采用强阳离子交换层析,利用肽段所带电荷数差异进行分离;
二维分离常常选择纳升反相层析,利用肽段的疏水性差异进行分离。
2.电喷雾串联质谱鉴定肽段
在肽段鉴定中,纳升级液相层析(nano-LC)常与电喷雾串联质谱( electrospray ionization,ESI)相连。
ESI的基本原理
利用高电场使MS进样端的毛细管柱流出的液滴带电,带电液滴在电场中飞向与其所带电荷相反的电势一侧。 液滴在飞行过程中变得细小而呈喷雾状,被分析物离子化成为带单电荷或多电荷的离子,使被分析物得以鉴定。
nano-LC-ESI-MS可以实现对复杂肽段混合物的在线分离、柱上富集与同步序列测定,一次分析可以鉴定的蛋白质数目超过1000个,而结合多维层析分离技术,可以利用鸟枪法一次实验鉴定上万个蛋白质。
第四节代谢组学
概述
细胞内的生命活动大多发生于代谢层面,因此代谢物的变化更直接地反映了细胞所处的环境
如营养状态、药物作用和环境影响等。
代谢组学( metabonomics)就是测定一个生物/细胞中所有的小分子组成,描绘其动态变化规律,建立系统代谢图谱,并确定这些变化与生物过程的联系的学科
一、代谢组学的任务是分析生物/细胞代谢产物的全貌
代谢组学分为四个层次
代谢物靶标分析( metabolite target analysis)
对某个或某几个特定组分进行分析;
代谢谱分析( metabolic profiling analysis)
对一系列预先设定的目标代谢物进行定量分析。
如某一类结构、性质相关的化合物或某一代谢途径中所有代谢物或一组由多条代谢途径共享的代谢物进行定量分析;
代谢组学
某一生物或细胞所有代谢物进行定性和定量分析;
代谢指纹分析( metabolic fingerprinting analysis)
不分离鉴定具体单一组分,而是对代谢物整体进行高通量的定性分析。
代谢组学主要以生物体液为研究对象,如血样、尿样等,另外还可采用完整的组织样品组织提取液或细胞培养液等进行研究。
血样中的内源性代谢产物比较丰富,信息量较大,有利于观测体内代谢水平的全貌和动态变化过程。
尽管尿样所含的信息量相对有限,但样品采集不具损伤性。
二、核磁共振、色谱及质谱是代谢组学的主要分析工具
由于代谢物的多样性,常需采用多种分离和分析手段。
核磁共振(nuclear magnetic resonance,NMR)、色谱及MS等技术是最主要的分析工具。
NMR
是当前代谢组学研究中的主要技术。
代谢组学中常用的NMR谱是氢谱(1H-NMR)、碳谱(13C-NMR)及磷谱(31P-NMR)。
MS
按质荷比(m/z)进行各种代谢物的定性或定量分析,可得到相应的代谢产物谱。
色谱-质谱联用技术
这种联用技术使样品的分离、定性、定量一次完成,具有较高的灵敏度和选择性。
目前常用的联用技术包括气相色谱-质谱(GC-MS)联用和液相色谱-质谱(LC-MS)联用。
三、代谢组学技术在生物医学领域具有广阔的应用前景
代谢组学所关注的是代谢循环中小分子代谢物的变化情况及其规律,反映的是内、外环境刺激下细胞、组织或机体的代谢应答变化。
与基因组学和蛋白质组学相比,代谢组学与临床的联系更为紧密。疾病导致体内病理生理过程变化,可引起代谢产物发生相应的改变。
应用
开展疾病代谢组研究可以提供疾病(如某些肿瘤、肝疾病、遗传性代谢病等)诊断、预后和治疗的评判标准,并有助于加深对疾病发生、发展机制了解;
利用代谢组学技术可以快速检测毒物和药物在体内的代谢产物和对机体代谢的影响,有利于判定毒物、药物的代谢规律,为深入阐明毒物中毒机制和发展个体化用药提供理论依据;
利用代谢组学技术对代谢网络中的酶功能进行有效的整体性分析,可以发现已知酶的新活性并发掘未知酶的功能;
由于代谢组学分析技术具有整体性、分辨率高等特点,可广泛应用于中药作用机制、复方配伍、毒性和安全性等方面的研究,为中药现代化提供技术支撑。
第五节其他组学
一、糖组学研究生命体聚糖多样性及其生物学功能
概述
生物界丰富多样的聚糖类型覆盖了有机体所有细胞,它们不仅决定细胞的类型和状态,也参与了细胞许多生物学行为,如细胞发育、分化,肿瘤转移,微生物感染,免疫反应等。
糖组学( glycomics)
概念
糖组学( glycomics)侧重于糖链组成及其功能的研究,其主要研究对象为聚糖。
具体内容包括研究糖与糖之间、糖与蛋白质之间、糖与核酸之间的联系和相互作用。
糖组学是基因组学和蛋白质组学等的后续和延伸。
因此,要深入了解生命的复杂规律,就必须有“基因组蛋白质组糖组”的整体观念。
这样才有可能揭示生物体全部基因功能,从而为重大疾病发生、发展机制的进一步阐明和有效控制,以及为疾病预测、新的诊断标记物的筛选及药物靶标的发现提供依据。
(一)糖组学分为结构糖组学与功能糖组学两个分支
糖组( glycome)指单个个体的全部聚糖,糖组学则对糖组(主要针对糖蛋白)进行全面的分析研究,包括结构和功能两方面内容。
因此可将其分为
结构糖组学( structural glycomics)
功能糖组学( functional glycomics)
糖组学的内容主要涉及单个个体的全部糖蛋白结构分析,确定编码糖蛋白的基因和蛋白质糖基化的机制。
因此,糖组学主要要回答4个方面的问题
什么基因编码糖蛋白,即基因信息;
可能糖基化位点中实际被糖基化的位点,即糖基化位点信息;
聚糖结构,即结构信息;
糖基化功能,即功能信息。
(二)色谱分离/质谱鉴定和糖微阵列技术是糖组学研究的主要技术
1.色谱分离与质谱鉴定技术
色谱分离与质谱鉴定技术为糖组学研究的核心技术,被广泛地应用于糖蛋白的系统分析。
通过与蛋白质组数据库结合使用,这种方法能系统地鉴定可能的糖蛋白和糖基化位点。
具体策略包括如下几个步骤
凝集素亲和层析-1(用于糖蛋白分离)
依据待分离糖蛋白的聚糖类型单独或串联使用不同的凝集素;
蛋白质消化
将分离得到的糖蛋白用蛋白酶Ⅰ消化以生成糖肽;
凝集素亲和层析-2(用于糖肽分离)
采用与步骤1相同的凝集素柱从消化液中捕集目的糖肽;
HPLC纯化糖肽;
序列分析、质谱和解离常数测定;
数据库搜索和聚糖结构分析以获得相关遗传和糖基化信息。
然后使用不同的凝集素柱进行第二和第三次循环,捕集其他类型的糖肽,以对某个细胞进行较全面的糖组学研究。
其中凝集素亲和层析亦称为糖捕获(glyco-catch)法。
2.糖微阵列技术
糖微阵列技术是生物芯片中的一种,是将带有氨基的各种聚糖共价连接在包被有化学反应活性表面的玻璃芯片上。
一块芯片上可排列200种以上的不同糖结构,几乎涵盖了全部末端糖的主要类型。
糖微阵列技术可广泛用于糖结合蛋白的糖组分析,以对生物个体产生的全部蛋白聚糖结构进行系统鉴定与表征。
但目前可用于微阵列的糖数量还非常有限,糖微阵列技术有待进一步的发展。
3.生物信息学
糖蛋白糖链研究的信息处理、归纳分析以及糖链结构检索都要借助生物信息学来进行。
目前这方面的数据库和网络包括CFG、KEGG和CCSD等。
(三)糖组学与肿瘤的关系密切
目前,2-DE已经成功地用于鉴定糖蛋白差异。
已报道有多种血清糖蛋白可作为肾细胞癌、乳腺癌、结直肠癌等的标记物;
糖基化改变普遍存在于肿瘤的发生、发展过程中,分析糖基化修饰对于深入研究肿瘤的发生机制及诊断治疗有着重要的价值;
糖基化差异也可用于构建特异的多糖类癌症疫苗,以发展新的免疫治疗策略。
与基因组学和蛋白质组学研究相比,糖组学的研究还处于起步阶段。
阻碍糖组学迅速发展的原因主要是糖链本身结构的复杂性和研究技术的限制。
但不管如何,糖组学作为基因组学和蛋白质组学的重要补充,将为人类在对生命本质深层次理解的进程中发挥越来越重要的作用。
二、脂组学揭示生命体脂质多样性及其代谢调控
概述
生命体脂质具有化学多样性和功能多样性的特点,其代谢与多种疾病的发生、发展密切相关。
很多疾病都与脂代谢紊乱有关,如糖尿病、肥胖病、癌症等。
因此,脂质的分析量化对研究疾病发生机制和诊断治疗,以及医药研发有非常重要的生物学意义。
脂组学( lipidomics)就是对生物样本中脂质进行全面系统的分析,从而揭示其在生命活动和疾病中发挥的作用。
(一)脂组学是代谢组学的一个分支
脂组学的研究内容为生物体内的所有脂质分子,并以此为依据推测与脂质作用的生物分子的变化,揭示脂质在各种生命活动中的重要作用机制。
通过研究脂质提取物,可获得脂组( lipidome)的信息,了解在特定生理和病理状态下脂质的整体变化因此,脂组学实际上是代谢组学的重要组成部分。
脂组学的研究有以下优势
只研究脂质物质及其代谢物。
脂质物质在结构上的共同点决定了样品前处理及分析技术平台的搭建较为容易,而且可以借鉴代谢组学的研究方法。
脂组学数据库的建立和完善速度较快,并能建立与其他组学的网络联系。
脂质组分析的技术平台可用于代谢组学的研究,促进代谢组学发展。
(二)脂组学研究的三大步骤分离、鉴定和数据库检索
1.样品分离
脂质主要从细胞、血浆、组织等样品中提取。
由于脂质物质在结构上有共同特点,即有极性的头部和非极性的尾部。 所以,脂质采用氯仿、甲醇及其他有机溶剂的混合提取液,能够较好地溶出样本中的脂质物质。
2.脂质鉴定
随着分析技术的不断发展,脂质的分析方法也在不断的改进。
总体而言,大部分的分析技术都能用来分析脂质
包括脂肪酸、磷脂、神经鞘磷脂、甘油三酯和类固醇等。
常规的技术有
薄层色谱(TLC)
气相色谱质谱联用(GC-MS)
电喷雾质谱(ESI/MS)
液相色谱-质谱联用(LC/MS)
高效液相色谱-芯片-质谱联用(HPLC-Chip/MS)
超高效液相色谱-质谱联用(UPLC/MS)
超高效液相色谱-傅立叶变换质谱联用(UPLC/FT-MS)
3.数据库检索
随着脂组学的迅速发展,相关数据库也逐步建立。
现有数据库能够查询脂质结构、质谱信息、分类及实验设计、实验信息等,其功能也越来越完善。
数据库的建立无疑成为推动脂组学自身发展的良好工具。
国际上最大的数据库LIPID Maps(http://www.lipidmaps.org/)是由美国国立综合医学研究所( National Institute of General Medical Sciences, NIGMS)组织构建的,它包含了脂质分子的结构信息、质谱信息、分类信息、实验设计等。 数据库包含了游离脂肪酸、胆固醇、甘油三酯、磷脂等八个大类共40673种脂质的结构信息(截至2017年1月)。
(三)脂组学研究促进脂质生物标志物的发现和疾病诊断
发现疾病相关的诊断标志物是进行疾病诊断的关键。
脂组学所提供的方法能够监测病人与正常人之间的脂质变化,从中找到差异较大的脂质化合物,作为疾病早期诊断的指标。
科学家定量研究了卵巢癌病人和良性卵巢瘤病人血清中各种胆固醇及脂蛋白的含量变化,结果表明:以载脂蛋白AⅠ(apoAⅠ)和游离胆固醇( free cholesterol, FC)为诊断指标排除卵巢瘤的正确率高达95.5%,综合 apoAⅠ、FC、高密度脂蛋白游离胆固醇(HDLFC)、高密度脂蛋白总胆固醇( HDLTC)、apoB及高密度脂蛋白-3(HDL3)片段诊断卵巢癌的准确率达到97.0%。另有证据报道溶血磷脂酸在卵巢癌的诊断中表现出高度的敏感性和特异性,能够作为早期诊断卵巢癌及术后随访的生物标志物。
总之,脂组学从脂代谢水平研究疾病的发生、发展过程的变化规律,寻找疾病相关的脂生物标志物,进一步提高疾病的诊断效率,并为疾病的治疗提供更为可靠的依据。
脂组学能够在一定程度上促进代谢组学的发展,并通过代谢组学技术的整合运用建立与其他组学之间的关系,最终实现医学科学的整体进步。
第六节系统生物医学及其应用
概述
HGP的完成极大地促进了医学科学的发展。
各种组学的不断发展以及集成已经形成了一门新的学科——系统生物医学( systems biomedicine)。
在这一大背景下,现代医学正酝酿着一场颠覆性的变革,分子医学的深入、精准医学的开展以及转化医学的发展等有望从分子水平突破对疾病的传统认识,从而彻底改变和革新现有的临床诊疗模式。
一、系统生物医学是以整体性研究为特征的一种整合科学
概述
系统生物医学应用系统生物学( systems biology)原理与方法研究人体(包括动物和细胞模型)生命活动的本质、规律以及疾病发生发展机制,实际上就是系统生物学的医学应用研究。
(一)系统生物医学强调机体组成要素和表型的整体性
系统生物医学从全方位、多层次(分子、细胞器、细胞、组织、器官、个体/基因型、环境因子、种群、生态系统)的角度,整体性揭示一个机体所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系及其效应。
以往的实验生物学仅关心个别或一批基因和蛋白质,系统生物医学则不同,它要研究一个细胞/机体内所有的基因、所有的蛋白质,特别是所有生物分子间的所有相互关系及其导致的生物学效应。 显然,系统生物医学是以整体性研究为特征的一种整合科学 (integrative science)。
(二)系统生物医学将极大地推动现代医学科学的发展
系统生物医学使生命科学由描述式的科学转变为定量描述和预测的科学,改变了21世纪医学科学的研究策略与方法,并将对现代医学科学的发展起到巨大的推动作用。
当前系统生物医学理论与技术已经在预测医学( predictive medicine)、预防医学( preventive medicine)和个性化医学(personalized medicine)中得到应用。
如应用代谢组学的生物指纹预测冠心病病人的危险程度和肿瘤的诊断以及治疗过程的监控;
应用基因多态性图谱预测病人对药物的应答,包括毒副作用和疗效。
如表型组学的细胞芯片和代谢组学的生物指纹将广泛用于新药的发现和开发,使新药的发现过程由高通量逐步发展为高内涵(high- -content)。
未来的治疗不再依赖于单一药物,而是使用一组药物(系统药物)的协调作用来控制病变细胞的代谢状态,以减少药物的副作用,维持疾病治疗的最大效果。
二、分子医学是发展现代医学科学的重要基础
概述
分子医学( molecular medicine)就是从分子水平阐述疾病状态下基因组的结构、表达产物、功能及其表达调控规律,发展现代高效预测、预防、诊断和治疗手段。
因此,分子医学实际上就是医学的一个分支学科
主体内容是分子生物学在医学中的应用,涵盖了其主要的理论和技术体系。
疾病基因组学、转录物组学、蛋白质组学、代谢组学等是开展分子医学的基础。
(一)疾病基因组学阐明发病的分子基础
疾病基因组学研究的两大任务
疾病基因(或疾病相关基因)
疾病易感性的遗传学基础
定位克隆(positional cloning)技术的发展极大地推动了疾病基因或疾病相关基因的发现和鉴定
该技术将疾病相关基因位点定位于某一染色体区域后,根据该区域的基因、EST或模式生物所对应的同源区的已知基因等有关信息,直接进行基因突变筛查,从而可确定疾病相关基因(见第二十五章)。
SNP是疾病易感性的重要遗传学基础
例如APOE基因单个碱基变异与阿尔茨海默病( Alzheimer disease,AD)的发生相关, 趋化因子受体基因CCR5中一个单纯缺失突变会导致对HIV的抗性等。
疾病基因组研究在全基因组SNP制图基础上,筛选和鉴定与疾病相关的SNP,从而阐明各种疾病易感人群的遗传学背景,为疾病的诊断和治疗提供新的理论基础。
(二)药物基因组学揭示遗传变异对药物效能和毒性的影响
药物基因组学( pharmacogenomics)是功能基因组学与分子药理学的有机结合。
药物基因组学以药物效应和安全性为目标,研究各种基因突变与药效及安全性的关系。
正因为药物基因组学是研究基因序列变异及其对药物不同反应的科学,所以也是研究高效/特效药物的重要途径,通过它可为病人或者特定人群寻找合适的药物。
药物基因组学广泛应用遗传学、基因组学、蛋白质组学和代谢组学信息来预测患病人群对药物的反应,从而指导临床试验和药物开发过程。
不断涌现的各种生物分析技术,如基因变异检测技术、SNP高通量扫描技术、药物作用显示技术基因分型研究技术等,为药物基因组学的进一步发展提供了技术支撑。药物基因组学使药物治疗模式由诊断定向治疗转为基因定向治疗。
(三)疾病转录物组学阐明疾病发生机制并推动新诊治方式的进步
疾病转录物组学是通过比较研究正常和疾病条件下、或疾病不同阶段基因表达的差异情况,从而为阐明复杂疾病的发生发展机制,筛选新的诊断标志物,鉴定新的药物靶点,发展新的疾病分子分型技术,以及开展个体化治疗提供理论依据。
例如,外周血转录物谱可作为冠状动脉疾病(coronary artery diseases,CAD)诊断与病程、预后判定的生物标志物。 CardioDx发展了基于23个基因表达谱的诊断试剂盒 Corus CAD,适用于早期阻塞性CAD的诊断。 再如,近年研究表明多种疾病(包括肿瘤)与miRNA密切相关,检测血清中 miRNA表达谱可指示某些疾病的发生。 目前已有HBV、心脏疾病(包括急性冠状动脉综合征、急性心肌梗死、高血压、心力衰竭等)、2型糖尿病和肝癌等的血清 miRNA作为诊断标记物的报道。 此外,miRNA还可作为某些疾病治疗的潜在靶点,例如针对 miRNA-182的反义寡聚核苷酸可以用于黑色素瘤肝转移的治疗。
(四)疾病蛋白质组学发现和鉴别药物新靶点
药物作用靶点的发现与验证是新药发现阶段的重点和难点,成为制约新药开发速度的瓶颈。
近年来,随着蛋白质纽研究技术的不断进步,蛋白质组学在药物靶点的发现应用中亦显示出越来越重要的作用。
疾病相关蛋白质组学研究可以发现和鉴定在疾病条件下表达异常的蛋白质,这类蛋白质可作为药物候选靶点。
疾病相关蛋白质组学还可对疾病发生的不同阶段进行蛋白质变化分析,发现一些疾病不同时期的蛋白质标志物,不仅对药物发现具有指导意义,还可形成未来诊断学、治疗学的理论基础。
许多疾病与信号转导异常有关,因而信号分子和途径可以作为治疗药物设计的靶点。
在信号传递过程中涉及数十或数百个蛋白质分子,蛋白质蛋白质相互作用发生在细胞内信号传递的所有阶段。而且,这种复杂的蛋白质作用的串联效应可以完全不受基因调节而自发地产生。通过与正常细胞作比较,掌握与疾病细胞中某个信号途径活性增强或丧失有关的蛋白质分子的变化,将为药物设计提供更为合理的靶点。
(五)医学代谢组学提供新的疾病代谢物标志物
代谢组学经过十余年的发展,方法正日趋成熟,其应用已逐步渗透到生命科学研究领域的多个方面,在医学科学中亦日益彰显出其强有力的潜能。
与基因组学和蛋白质组学相比,代谢组学研究侧重于代谢物的组成、特性与变化规律。
通过对某些代谢产物进行分析,并与正常人的代谢产物比较,可发现和筛选出疾病新的生物标志物,对相关疾病作出早期预警,并发展新的有效的疾病诊断方法。
举例
例如通过代谢组学的研究,证实血清中VLDL、LL、HDL和胆碱的含量/比值可以判断心脏病的严重程度;
血清中脂蛋白颗粒的组成;
如脂肪酸侧链的不饱和度、脂蛋白分子之间相互作用的强度(而不是脂质的绝对含量)是影响高血压病人收缩压的主要因素
通过比较病人与正常人尿样中嘌呤和嘧啶化合物图谱,能够实现绝大多数核苷酸相关代谢遗传疾病的诊断。
三、精准医学是实现个体化医学的重要手段
精准医学(precision medicine)
目的
全面推动个体基因组研究,依据个人基因组信息“量体裁衣”式( tailored)制定最佳的个性化治疗方案,以期达到疗效最大化和副作用最小化。
目标
短期目标
癌症治疗
癌症是常见的疾病,其全球发病率和死亡率逐年上升,而目前临床上尚缺乏有效的、针对性强的治疗方法。精准医学希望通过个体基因组研究,发现和鉴定与癌症发生发展相关的基因和调控因子,发掘新的肿瘤标志物,发展新的肿瘤分子分型技术,开展基于个体基因组的个体化治疗方法与技术。
长期目标
健康管理
精准医学通过科技进步,将其优势拓展到健康和医疗的各个方面,从而提升对疾病风险评估,疾病发生、发展和转归机制的认识,以及疾病最佳治疗方案的制定与实施。
我国于2016年正式启动国家重点研发计划“精准医学研究”点专项
按照全链条部署、一体化实施的原则,部署新一代临床用生命组学技术研发,大规模人群队列研究,精准医学大数据的资源整合、存储、利用与共享平台建设,疾病防诊治方案的精准化研究,精准医学集成应用示范体系建设等五大研究任务。
四、转化医学是加速基础研究实际应用的重要路径
转化医学( translational medicine)强调以临床问题为导向,开展基础-临床联合攻关,将基因组学等各种分子生物学研究成果迅速有效地转化为可在临床实际应用的理论、方法、技术和药物。
转化医学的核心是要在实验室和病床( bench to bedside,简称B2B)之间架起一条快速通道。
转化医学产生的背景主要基于以下几个方面
基础研究与临床问题解决之间严重脱节;
疾病谱的转变使医疗成本大大增加;
基础科学研究积累大量数据的意义需要解析;
基础研究和药物开发及医学实践三者需要整合。
根本目的
围绕以临床问题为导向,开展医学科学实践,是解决医学根本性问题的有效途径,也是转化医学的根本目的。
转化医学的目标就是将生命科学和生物技术及相关的现代科学技术整合、转变现有的医学模式的推动医疗改革,提高人民的健康水平和生活质量。
从而达到更精确的预警与诊断,更有效的干预和治疗,降低发病率、推迟发病平均年龄,提高治愈率、减少重症病人,以及降低医疗的综合成本。