详细信息

关于Hi-C:你不知道的事(上)

日期:2016年9月23日 15:02

    基因组学发展至今,DNA序列的获取、解读和注释都已经比较容易实现,基于DNA序列人们发现大量的调控元件并对基因表达和染色质状态进行了定义。然而随着研究的深入,研究人员发现,这些离散的调控元件并不能有效地解释许多基因的调控机制。生物学中有一个基本共识——“结构决定功能”,线性排列的DNA序列无法解释的调控问题,通过基因组三维结构研究往往会得到意想不到的惊喜。

doi: 10.1360/N972014-00163

三维基因组学,是指在考虑基因组序列、基因结构及其调控元件的同时,对基因组序列在细胞核内的三维空间结构,及其对基因转录、复制、修复和调控等生物过程中功能的研究。三维基因组研究技术包括3C、Hi-C和ChIA-PET等,对于这些技术大家可能也只是略有耳闻。Hi-C作为其代表性技术,究竟有哪些作用,下面就请各位拿(bai)出(hao)零(zhi)食(bi)随小编一起扒一扒关于Hi-C的那些事儿。

Hi-C的三大应用

基于Hi-C的实验数据,主要可以进行三大块应用,包括辅助基因组组装、揭示基因组三维结构、基因组单倍型图谱构建。

No.1辅助基因组组装

Ø 技术原理

我们知道,Hi-C技术实际分析的是基因组染色体上各位点间的互作概率。Lieberman-Aiden的文章中提到,基因组上互作概率有两个重要特征。如下图1所示:A)染色体内互作高于不同染色质间互作。B)染色体内部,两点间距离越远,互作概率越低。

图1. 基因组互作概率特征

于是,利用此特征,Joshua N Burton等人建立了一套基于Hi-C技术的基因组辅助组装与提升方法1。这套方法基本流程如图2所示。首先,利用染色体内互作概率高于染色体间互作这一特征将contigs分组,每一组将对应一条染色体。而后利用染色体内部距离越近互作概率越高这一特征将contigs排序并进一步确定方向。

图2. Hi-C技术辅助基因组组装流程

Ø 组装效果测试

 为验证该方法,Joshua N Burton等人采用了人类,小鼠,以及果蝇的Hi-C数据(表1)对他们的方法进行了测试。

表1. 组装数据量

表2. Hi-C辅助基因组组装结果评估结果如表2所示,单纯利用Hi-C技术将contigs分配成染色体的准确率可以达到98%。而排序的正确率可以达到94%。

Ø 影响Hi-C组装的因素

研究者还进一步评估了不同基因组片段大小以及不同Hi-C测序数据量对Hi-C辅助基因组组装的影响。他们发现:基因组片段越大(即N50越大),组装效果越好。相同N50时,数据量越高,组装效果越好。

Ø 其他Hi-C组装案例

TingXie等人利用这一方法成功实现了拟南芥基因组的直接组装。他们以拟南芥生态型Landsbergerecta(Ler) 为材料,采用约102 M PE reads的Hi-C数据对Ler的原始基因组(1705Scaffolds,total length:112.61 Mb,N50:341.63 kb)进行了辅助组装并与拟南芥参考基因组进行了比较。结果如图3所示:Scaffolds分配成染色体的准确率达到97%,而排序的正确率可以达到95%。

图3. 拟南芥基因组Hi-C辅助组装结果

Ø Hi-C组装的优势

(1)Hi-C包含全基因组互作信息,序列覆盖更全,定位更完整;

(2)无需群体,单个个体就能实现染色体定位,结果误差小、更可靠;

(3)对已组装的基因组进行纠错,周期短、成本低。

Tips

Hi-C还有哪些其他作用,敬请期待下一篇文章。

参考文献

[1]. Li G L, Ruan Y J, Gu R S, et al.Emergence of 3D genomics (in Chinese). Chin Sci Bull (Chin Ver), 2014, 59:1165–1172.

[2].  Erez L A, Berkum N L V, Louise W, et al.Comprehensive Mapping of Long-Range Interactions     Reveals Folding Principles of the HumanGenome[J]. Science, 2009, 326(5950):289-.

[3].  Burton J N, Adey A, Patwardhan R P, et al.Chromosome-scale scaffolding of de novo genome assemblies based on chromatininteractions[J]. Nature Biotechnology, 2013, 31(12):1119-25.

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: