导图社区 系统遗传学汇报
系统遗传学汇报的思维导图,DNA测序技术的进步使得全基因组范围内鉴定人类生殖细胞和体细胞突变变为可能。
编辑于2023-09-27 10:39:04 湖北省The origins, determinants, and consequences of human mutations
摘要
生殖细胞突变(germline mutation)
遗传性疾病
进化变化
体细胞突变
癌症
内容
回顾近期基因组突变的频率、谱系和决定性因素的研究,以及这些变量如何影响我们对孟德尔定律和复杂人类疾病的看法
梳理概念化突变后果的模型,并概述了未来研究的几个关键领域
介绍
据估计,每个人平均携带约60个来自其父母生殖细胞的新生点突变(个体之间存在相当大的差异)
发育和生命周期中出现的体细胞突变数量也很惊人
突变多
DNA测序技术的进步使得全基因组范围内鉴定人类生殖细胞和体细胞突变变为可能
但是在解释突变功能、表型和适应性影响方面仍存在空白
人类生殖细胞突变率
突变率从高渗透性孟德尔病的发病率(incidence of highly penetrant Mendelian diseases)中得到
一项汇总约60个基因loci的数据,估计每代每个碱基对的评价生殖细胞突变率约为1.28*10-8
基于系统发育方法的突变率估计
2.2*10-8/bp/代
可能受到突变和选择以外的进化过程影响
如影响哺乳动物替代率的偏移基因转换
是一种与遗传学和分子进化相关的现象,它指的是在染色体重组过程中,一种等位基因(alleles)更有可能被选择,从而在后代中频率增加的现象。这个过程与自然选择不同,它是由于DNA修复机制的偏差或倾向性而发生的。 偏向性基因转换通常发生在DNA双链断裂修复的过程中,特别是在同源重组(homologous recombination)时。在这个过程中,一个受损的DNA链通常会通过参考与其同源的另一条DNA链进行修复。然而,有时在修复过程中,一个等位基因会被更频繁地选择,而另一个等位基因则会受到削弱。
尝试估计小插入和缺失(indels)以及拷贝数变异(cnv)的从头突变率。
短读数的全基因组测序可能存在未确定的结构事件,特别是中等大小的插入或缺失(28)。随着测序技术的不断改进,对结构变异的生殖细胞突变率的更精确估计可能会出现。
新测序技术识别谱系中的新突变
更直接的突变率估计
1.0*10-8/bp/代
意义
但它对我们理解人类进化和疾病具有重要意义(例如,影响有效种群规模的估计,以及推断现代人类与其他古人类群体分离的时间,现代人类何时分散出非洲,以及更普遍的现代人类种群之间分化的时间) 编码序列中的新生突变和罕见变异不仅会导致罕见的孟德尔病(16),还会导致常见的遗传异质性疾病,如神经发育障碍(23)和早发性乳腺癌(24)。 因此,对种系突变率的准确估计对于解释人类疾病的模式、流行和结构也至关重要(26)。
古人类死亡和现在发生的缺失突变估计突变率
1.1*10-8
自合区域内杂合变异累积
1.2*10-8
生殖细胞突变
速率和模式的显著异质性影响因素
最大的影响出现在CpG岛上
胞嘧啶的突变率比其他二核苷酸高10倍
甲基化胞嘧啶自发脱氨成胸腺嘧啶
不均匀修复
染色质结构
复制时间
性别和父母年龄的影响
大多数由DNA复制错误引起的生殖细胞突变是从父亲遗传的
基于家系的测序最近对父亲年龄和新生点突变率之间的关系产生了定量的见解。具体来说,据估计,父亲年龄可以解释95%的后代新生突变数量的变化
进入青春期后,每个父亲年观察到额外的1到2个突变(4);基因区新生突变的比例每父亲年增加0.26%,因此40岁父亲所生的后代携带的基因突变数量是20岁父亲所生子女的两倍(分别为19.1和9.6)(2)。 除了点突变外,非复发性新生CNV的发生率也显示出强烈的父系偏见和年龄效应(36),这暗示了CNV形成的基于复制的机制,如分叉失速和模板切换(37)。更广泛地说,男性和女性在突变率、谱和年龄影响上的差异反映了各种类型的突变起源的潜在机制。
体细胞突变和疾病
受精卵到成人,人类经历数万亿次细胞分裂,每次分裂都会积累体细胞突变
体细胞突变率是生殖细胞的4-25倍
与癌症密切相关
因为突变只需要与一个细胞的生命相适应,而不是与整个生物体的生命相适应,所以在癌症中观察到的突变谱比在生殖系突变(例如,非整倍体、染色体分裂等)中观察到的突变谱要多样化得多。
不同癌症类型的突变率变化与组蛋白标记有关,组蛋白标记定义了抑制性与开放染色质、复制时间和转录偶联修复
体细胞突变是更广泛的人类疾病的基础,不止针对癌症
发育早期发生的体细胞突变构成了孟德尔遗传病的部分基础
一些单基因疾病完全是由体细胞突变引起的,可能是因为生殖细胞突变在胚胎发育过程中是致命的。在未受影响的亲本中,影响性腺组织的体细胞突变可导致多个子女具有相同的新生突变(种系嵌合体)。总的来说,体细胞突变在癌症以外的疾病中的作用可能比文献记载的更大。
突变效应的概念模型
解释突变后果
效应的分布
群体遗传学
新突变的适应度效应分布(DFE,the distribution of fitness effects)
分布复杂,在生物体和基因组之间都是不同的
有害突变通常具有适合度分布效应,可能是多模态的,可能因功能类别而异
有利突变罕见,适合度效应分布很大程度上未被探索
直接方法
DFE
适应度
携带突变等位基因的基因型相对于携带野生型等位基因的基因型的繁殖成功率来定义
其分布即DFE
方式
用模式生物进行实验估计
比较基因组的固定或持续变异模式
人类基因组中编码和调控序列的DFE明显不同
致病性
突变在单个个体中引起临床表现疾病的倾向
历史上看,致病突变被定义为孟德尔疾病
将致病性看作是突变或变异赋予特定疾病或疾病风险的一种连续特性可能更合理
a distribution of pathogenic effects (DPE)
原则上可以通过检查与特定疾病相关的基因中单个突变的odds ratio(比值比)测量。但实践中有挑战性
1.突变通常在表型基础上确定,所以缺乏无病个体中致病性突变发生频率的量化; 2.原则上每一个与生命相容的突变都会在几百个现代人身上存在,但是我们不具备完整几十亿人的基因组数据,所以大部分的突变仍然很难被观察到。 只能量化GWAS中那些上升到高等位基因频率的变异,难以针对罕见突变量化
分子功能
a distribution of molecular effects (DME)
突变在分子水平上具有破坏性作用
DME可以被测量
可用来推断DFE和DPE
相关
给定序列的三者无疑相关
大分子效应的变异更可能有害/致病,从而致病性效应更高
但是分布之间的关系不直接
变异可能对疾病状态没有可测量的影响,却可能在长期尺度上影响生殖适应性
变异可能有很大分子效应,但是只会产生依赖环境的后果
根据研究目标选取最佳/有意义指标
突变率、突变效应和人类疾病的相互作用
任何给定的疾病都有其自身的一套潜在突变,这些突变会导致风险,在发生几率和致病几率方面都有特定的分布。对于大多数孟德尔疾病,突变目标主要由特定基因中改变蛋白质的突变组成。对于遗传异质性疾病,可能有多达数百个靶基因。
突变模式和疾病eg
非同义突变引起的疾病的突变谱高度异质
精氨酸和甘氨酸变化占此类突变30%
突变率随父亲年龄的增加而显著增加
新生突变的复制时间偏差存在于年轻父亲,而不存在于年长父亲
癌症中的某些体细胞突变似乎更有可能发生在特定的生殖细胞单倍型上
复制时序定量性状位点rtQTL(生殖细胞变异)影响JAK2的复制时间
JAK2在不同类型的单倍型上有不同的变异概率
未来挑战
关于形成突变谱的基本生物学机制仍然存在众多未知
研究更多的突变经验模式
测序技术进步的推动
全基因组测序确定的新生生殖系突变的数量将在未来几年内呈指数级增长,在研究中确定数十万或数百万种所有类型的新生突变。
从单细胞中精确测序全基因组的能力,直接或扩展离体(57),将进一步我们对体细胞突变的速率和模式的理解。
更好地界定个体间生殖细胞和体细胞突变率的遗传变异程度,以及这种遗传变异如何导致疾病。将个体突变率估计纳入特定疾病终生风险的推断,也具有相当大的价值。
大规模平行实验方法,包括一些基于基因组编辑的方法,将有助于测量不同序列的DME和DFE,包括蛋白质编码和调控序列