意见与建议
首页市场动态市场资讯 > 关于基因组的5种主流测序组装策略,你都知道吗?
详细信息

关于基因组的5种主流测序组装策略,你都知道吗?

浏览次数: 日期:2016年11月25日 10:25

自2001年人类基因组计划完成以来,大量的物种基因组陆续发布,关于基因组组装方面的研究文章接踵而来。从一开始利用一种方法对多种物种基因组研究,到后来采用不同研究方法先后对同一个物种进行基因组装,相关基因组组装研究成果开始在《Nature》和《Science》等顶级期刊上发表,掀起科研界的又一阵浪潮。基因组研究方法的选择有这么重要,你都知道哪些呢?小编将推出目前最主流的5种基因组研究方法,希望可以给爱学习的您带来一些帮助,小编还给大家准备了各种方案的文献集锦,赶紧收藏起来吧!

一.Illumina测序技术

以Illumina为主的二代测序是目前应用最广的高通量测序技术,其技术原理是采用可逆性末端边合成边测序反应。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。利用该技术,可以对任何物种(包括动物、植物、细菌、病毒、寄生虫等)在DNA水平上进行全基因组测序、基因组靶向区域测序,检测基因组范围内的遗传变异或多态性,在细菌、病毒等病原溯源上分辨率最高;然而,NGS技术由于其高GC区域无法准确测定、高重复序列无法跨越和海量短序列等问题,无法很好地组装复杂基因组。

 

图1. Illumina测序原理

二.PacBio测序技术

美国太平洋生物公司(Pacific Biosciences,PacBio)开发的三代测序技术称为SMRT测序(Single Molecule Real-Time Sequencing),该技术建立在两项革命性的发明基础之上,从而攻克了测序领域的重大难题。第一,零模波导孔技术(Zero-mode Waveguides,ZMWs)使激发光被限定在单分子纳米孔底部一定范围内,过滤了背景噪音。第二,荧光基团结合在核苷酸的磷酸基团上,帮助DNA聚合酶完成一个全天然的DNA链合成过程。PacBio平台的碱基荧光标记在3‘端磷酸键。在DNA合成过程中对应的碱基配对合成时,荧光基团会随磷酸键断裂自动脱落,即合成的DNA链不会残留荧光标记,和天然的DNA链合成产物一致,模拟生物体内DNA合成过程,PacBio的读长主要是依靠聚合酶的效率,平均读长10-15Kb,最长可达60Kb。这些长序列读取能够轻松跨越重复区域,大大简化了基因组组装,同时,测序过程中没有经过DNA的扩增,从而减少了由于PCR扩增偏好性导致的错误。PacBio测序技术超长读长解决了二代测序技术由于读长过短引发的一系列问题,例如重复序列的组装,结构变异的识别等,极大地提升了基因组组装质量。然而三代测序虽然在读长上具有优势,但是在通量和成本上却让研究人员望而却步。好消息是去年10月PacBio公司已经发布了升级版三代测序仪PacBio Sequel,预计通量提升5~10倍,照这个趋势发展,小编觉得PacBio的测序应用该是时候走入新时代了吧。

图2. PacBio测序原理

三.Hi-C测序技术

Hi-C技术(High-throμghput Chromatin conformation caputure)是利用高通量技术研究全基因组范围内染色体间互作的一种三维基因组技术。近年来Hi-C研究揭示了大量基因组特征,其中包括:(1)基因组中互作以顺式互作为主,即同一染色体内的互作;(2)大部分基因互作出现在同种单体型中。因此,基于Hi-C数据中染色质区域间的互作强度呈现的随距离增加而减弱的规律,以此规律可以用来判断scaffolds 的分类及相邻关系,从而应用于辅助基因组组装,将基因序列组装到染色体水平。由于该技术对DNA的完整性要求比较高,而植物DNA提取过程中需要去除细胞壁,这一过程对DNA的完整性会造成破坏,所以到目前为止该项技术在动物基因组研究中应用较多,而植物中仅发表了在拟南芥基因组组装中的应用。

图3.Hi-C组装原理

四.BioNano酶切技术

BioNano Irys系统利用内切酶对DNA进行识别、酶切、再次合成并标记荧光,在基因组范围内生成多个特异性的酶切标记位点,再利用极细的毛细管电泳把DNA分子拉直,将每个DNA单分子线性化展开,进行超长单分子高分辨率荧光成像,即生成了一幅幅酶切位点分布图。Irys的超长序列读长能够大大简化基因组组装,基于已有的测序数据,对全基因组组装进行优化,光学图谱能够提供大尺度下的远程信息,跨越重复片段和一些包含复杂元件的区域,可以用于辅助基因组复杂区域的组装大片段文库能够跨越重复区域,展示出片段之间的位置关系,对已测序基因组进一步优化,辅助高通量测序数据进行再拼接和分析,使基因组信息更加完整。通过分析软件组装得到全基因组的连锁图谱,结合组装的Scaffold(Contig)序列可有效的提升Scaffold的长度。

 

图4.BioNano辅助组装原理

五.10X Genomics技术

10X Genomics,2015年备受瞩目的测序黑马,由于开发出了一套巧妙的建库方案,使得Illumina这种短读长二代测序仪可以测序10kb以上的DNA片段,一时间吸引无数人的目光。10X Genomics公司的linked reads技术本质上是将barcode序列引入长序列片段,通过将长片段分配到不同的油滴微粒中,利用GemCode平台对长片段序列进行扩增引入barcode序列以及测序接头引物,然后将序列打断成适合测序大小的片段进行测序(图5),通过barcode序列信息追踪来自每个大片段DNA模板的多个Reads,从而获得大片段的遗传信息。通过linked reads结合常规二代测序组装得到的Scaffold,可搭建准确度更长的Scaffold。利用10X Genomics linked reads方法能够显著提高Illumina short read组装的Scaffold的长度,而且组装的基因组具有较高的准确性。说到这里大家要注意了,10X的技术,其Coverage一样是受GC含量影响较大的,那么如果真要应用10X技术,那么必须注意目标DNA的GC含量分布最好能控制在30~70%。

 

图5. linked reads文库构建过程

图6. 10x genomics linked reads辅助基因组组装流程图

小编寄语

基因组研究的方法多种多样,以上小编只为介绍了近年来应用较多的几款,而且这些方法还可以按照老师的需求进行排列组合:二代+三代;二代+10x genomics;三代+BioNano;三代+Hi-C ……。这么多种搭配,总有一款适合你。

 

相关文献

1.Scally A, Dutheil J Y, Hillier L D W, et al. Insights into hominid evolution from the gorilla genome sequence[J]. Nature, 2012, 483(7388):169-75.(Illumina)

2.Gordon D, Huddleston J, Chaisson M J, et al. Long-read sequence assembly of the gorilla genome.[J]. Science, 2016, 352(6281).(PacBio)

3.Burton J N, Adey A, Patwardhan R P, et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions[J]. Nature Biotechnology, 2013, 31(12):1119-25.(Hi-C)

4.English A C, Richards S, Han Y, et al. Mind the Gap: Upgrading Genomes with Pacific Biosciences RS Long-Read Sequencing Technology[J]. Plos One, 2012, 7(11):e47768-e47768.(Illumina+PacBio)

5.Pendleton M, Sebra R, Pang A W C, et al. Assembly and diploid architecture of an individual human genome via single-molecule technologies[J]. Nature Methods, 2015, 12(8).(PacBio+BioNano)

6.Mostovoy Y, Levy-Sakin M, Lam J, et al. A hybrid approach for de novo human genome sequence assembly and phasing.[J]. Nature Methods, 2016, 13(7).(BioNano+10X Genomics)


所属类别: 市场资讯

该资讯的关键词为: