CRISPR-Cas9技术包含两种重要的组分,一种是行使DNA双链切割功能的Cas9蛋白,而另一种则是具有导向功能的gRNA(guide RNA)。
CRISPR-Cas9技术利用一段与靶序列互补的gRNA引导Cas9核酸酶对特异靶向DNA进行识别和切割,造成DNA的双链或单链断裂,然后,细胞会利用自身具备的两种DNA修复机制对断裂的DNA进行修复,即非同源性末端接合(Non-homologous end joining, NHEJ)或同源介导的修复(Homology-directed repair, HDR)
非同源性末端接合就是通过DNA连接酶将双链断裂(DSBs)末端直接连接的一种修复过程,不依赖于同源DNA序列。这种连接过程简单粗暴,虽然迅速高效,但是会随机造成一些序列的缺失或插入,导致无法精准编辑。
同源介导的修复则是以未受伤的姐妹染色单体的同源序列作为其修复的模板。虽然同源介导的修复速度较慢,效率较低,但是非常精准,可以使基因组修复到完美如初。
利用两种修复机制,可以实现基因的插入和敲除。
没有模板的情况下,利用NHEJ修复,随机插入或缺失序列造成基因敲除。
有模板存在的情况下,可通过HDR修复在剪切位点引入目的修饰基因,实现基因的定点修改。
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,充当了防御外源遗传物质的“基因武器”。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats—成簇的规律间隔的短回文重复序列,分布在40%的已测序细菌和90%的已测序古细菌当中。下图展示了完整的CRISPR位点的结构。其中,CRISPR序列由众多短而保守的重复序列区(repeats)和间隔区(spacer)组成。重复序列区含有回文序列,可以形成发卡结构。而间隔区比较特殊,它们是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。而在上游的前导区(leader)被认为是CRISPR序列的启动子。另外,在上游还有一个多态性的家族基因,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因(CRISPR associated,Cas)。目前已经发现了Cas1-Cas10等多种类型的Cas基因。Cas基因与CRISPR序列共同进化,形成了在细菌中高度保守的CRISPR/Cas系统。