意见与建议
首页市场动态市场资讯 > Hi-C系列二:解码基因组三维结构
详细信息

Hi-C系列二:解码基因组三维结构

浏览次数: 日期:2016年9月23日 15:01

Hi-C作为三维基因组研究的代表技术,近期因在基因组组装方面的出色表现获得了大批基因组学研究人员的关注,大家发现原来通过全基因组片段互作等统计学信息可以有效地辅助和提升基因组组装。上一篇文章中小编对Hi-C在基因组组装方面的进行了详细的介绍(Hi-C系列一:基因组组装利器),但实际上,Hi-C辅助基因组组装仅仅只是Hi-C技术强大功能体系中的一小部分而已,作为高通量的染色质构象捕获技术(High-throughput Chromatin Conformation Capture),其强大的功能更多地是应用于基因组三维结构的解析和破译。

一、Hi-C技术

Hi-C技术成功应用的关键包含了两个部分:实验处理和数据分析。

1、实验技术

Hi-C的实验技术是由3C技术演化,融入了生物素捕获和高通量测序而来的。通过图1所示标准实验流程[1],我们最终将获得全基因组范围内空间距离接近的DNA序列信息。

Step1:利用甲醛将细胞核内自然状态下的DNA与蛋白质相交连,使空间上接近的DNA被固定住;

Step2:使用限制性内切酶将基因组DNA切开并用带有生物素的碱基补平酶切末端;

Step3:DNA平端连接,将空间固定在一起的连接起来形成嵌合体DNA;

Step4:片段解交联并使用超声波打断,利用生物素进行捕获获得嵌合体DNA片段;

Step5:生物素捕获后的DNA片段建库并进行双端测序;

2、数据处理

通过Hi-C实验以及高通量测序,我们会获得大量全基因组范围内空间距离接近的DNA序列信息。这些信息是来自目标生物体内多个细胞的综合数据,因此在研究基因组互作时需要对此数据进行过滤和统计学分析。如图2所示,Hi-C数据的标准处理流程[2]主要包括:序列比对定位,数据过滤,数据Binning(将数据分成小单元)和数据校正。

我们要将测序得到的Hi-C双端序列与参考序列进行比对,以将序列定位。这里仅双端均唯一匹配到参考序列上的paired reads才能用于后续分析。而为了提唯一匹配率,衍生出了各种比对策略。比如Imakaev等人提出的迭代匹配[3](Iterative Mapping)。

二、Hi-C互作研究结果展示

1、互作矩阵构建

我们将基因组参考序列按照一定的大小分配成固定的区块(bins)。通过将过滤后双端序列两端分别分配到基因组上不同的bins内,我们就可以构建出该物种的基因组互作矩阵图谱。这个指定的大小就是互作图谱的分辨率,而矩阵内的每个值代表其在坐标轴上的bin bin内存在多少对Hi-C reads。即这两个bins间发生了多少次“互作”。表1是新月柄杆菌500kb分辨率下的基因组互作矩阵[4],每一格的数据代表的是矩阵互作位点的PE reads数。其中第2行第5列的数字表示Hi-C数据中两端分别匹配在基因组上0.5Mb~1Mb区域与2Mb~2.5Mb区域的数据有68495条。如果用渐变的颜色代表表1矩阵中的每个点,我们可以绘制基因组互作图谱热图(图4)。

2、数据校正

Hi-C数据中由于各种原因会导致其在基因组不同位置间存在偏差。因此,在数据处理的最后一步,我们会对互作矩阵进行校正,使其数据在基因组上每个位点的覆盖度一致。如图5所示,校正前的矩阵在基因组上的覆盖度存在差异,而校正后的矩阵在基因组上每个位点的覆盖度一致。相比原始矩阵,校正后矩阵的每个点反映了其对应的基因组上两点间的互作概率。通过矩阵的校正,我们可以降低数据的噪音从而凸显出有意义的互作。

3、互作图谱分析

互作图谱是Hi-C数据的最终展示,以及后续分析的基础。基于校正后的互作图谱,我们可以分析:

  • 染色质上大型活跃及非活跃区域compatrment;

  • 染色质上局部高度有序结构TAD;

  • 染色质上点对点的显著互作loops;

  • 染色质的空间3D模型;

如图6是新月柄杆菌10kb的基因组互作热图[4]。从图中我们可以看到新月柄杆菌环状基因组的两个臂间空间上相互靠拢,具体体现为heatmap上副对角线上互作强度较高使互作热图呈现X型。同时,我们还可以看出新月柄杆菌的基因组在空间中折叠成多个相对独立的结构域,体现为heatmap上延着主对角线分布的正方形结构。

参考文献

1. Lieberman-Aiden, E.et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289-93 (2009).

2. Lajoie, B.R., Dekker, J. & Kaplan, N. The Hitchhiker's guide to Hi-C analysis: practical guidelines. Methods 72, 65-75 (2015).

3. Imakaev, M.et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nat Methods 9, 999-1003 (2012).

4. Le, T.B., Imakaev, M.V., Mirny, L.A. & Laub, M.T. High-resolution mapping of the spatial organization of a bacterial chromosome. Science 342, 731-4 (2013).

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: