意见与建议
首页市场动态市场资讯 > Hi-C数据类型
详细信息

Hi-C数据类型

日期:2016年9月23日 15:02

在Hi-C测序的原始数据中存在以下各种类型的序列,它们反映了Hi-C文库的主要DNA分子类型,具体分类如下图所示:

valid pair:符合Hi-C实验预期,由补平并携带生物素标记的酶切位点将基因组上不同位点DNA连接在一起形成的嵌合体DNA片段;

single side:仅有一端序列可以唯一匹配到基因组上的DNA片段;

self circles:同一位点DNA环化连接形成的DNA,它主要由单一酶切片段两端相连接,经超声波打断,捕获并测序产生;

dangling ends:双端均在同一基因组位置上的DNA片段,它源自未经过连接反应,最终却被捕获测序产生的数据;self circles与dangling ends合起来称为same fragments;

unmapped:双端均无法唯一匹配到基因组上的DNA片段;

在Hi-C分析中,仅valid pair可以反映基因组上位点与位点间的互作信息。因此,将Hi-C双端序列比对到参考基因组上后需要进行数据过滤。而将valid pair序列去除PCR冗余后的数据就是Hi-C分析的最终有效数据。该数据占所有双端唯一匹配数据的比率是评价Hi-C实验的重要指标。

 

参考文献

1. Imakaev, M.et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nat Methods 9, 999-1003 (2012).

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: