植物在生态系统中扮演着重要角色,其负责维持和调节物质循环、水循环及能量循环。对现存的植物进行测序和组装,可以更好地理解植物对气候变化的敏感性。随着测序技术的不断进步,以PacBio和ONT为代表的三代测序因长读长、无GC偏好性等特点而逐渐成为植物基因组测序组装的首选技术。但植物基因组通常杂合率高、重复序列多、倍性复杂,再加之DNA提取困难(具有坚韧细胞壁、次生代谢物含量多),使得植物基因组从测序到组装往往需要经历较长的时间。因此,如何快速实现植物从叶片到基因组(LeafGo),是目前诸多植物基因组研究者比较关心的问题。
近日,bioRxiv在线发表了题为LeafGo: Leaf to Genome, a quick workflow to produce high-quality De novo genomes with Third Generation Sequencing technology的研究论文,该研究介绍了一种植物长读长测序的框架体系“LeafGo”,将高质量(HMW)的DNA与HiFi测序、Hifiasm组装相结合,7天内完成了两种桉树染色体水平基因组的组装(包含提取、文库制备、测序、组装),从而证明了“HiFi+Hifiasm”在植物从叶片到基因组中的高效性、准确性和重要性。
图1 文章发表信息
01
LeafGo流程简介
如图2所示,LeafGo流程以7天为一个周期,包含植物叶片预处理、DNA提取、文库制备、上机测序、基因组组装等。其中,HMW DNA的提取需要1天,文库制备需要1-3天,测序与组装需要3天。
图2 LeafGo流程
在DNA提取阶段,研究者随机选取7种植物,先进行黑暗预处理,再用改良的Qiagen Genomic protocol方法提取DNA,并从实验人员、操作时间等角度评估此提取方法的准确性,结果均能提取到HMW DNA。
(https://www.protocols.io/view/workflow-for-generating-hmw-plant-dna-for-third-ge-bafmibk6)
图3 LeafGo流程中HMW DNA的提取方法
02
两种桉树基因组的组装
三代测序技术包括CLR、HiFi、ONT等,为选择最合适的测序方法来用于LeafGo流程,研究者对两种桉树(野桉、赤桉)分别构建CLR、HiFi与ONT文库,随后分别在Sequel 、Sequel II 、 GridION进行上机测序。结果表明,Sequel的CLR平均产出11.5G/cell,读长36.6Kb;Sequel II的CLR平均产出167.6G/cell,读长36.4Kb;Sequel II的HiFi平均产出22.2 G/cell,读长19.8 Kb;ONT的平均读长41.4Kb。经过数据质控,研究者最后对CLR与HiFi 的桉树样本数据分别进行了组装(表1)。
表1 两种桉树样本CLR与HiFi组装结果的统计
由表中可看出,对于同一样本来说,与CLR相比,HiFi组装的Contig数目更少、N50更长、最长的Contig更大,其中赤桉HiFi组装的Contig N50达到了18.9Mb;BUSCO评估表明,HiFi组装的基因组完整性超过97%,大于CLR的93%。综上,在LeafGo流程中,选择HiFi测序,可以得到连续性更好、准确性更高的基因组。
03
HiFi+Hifiasm的其它优势
为进一步体现出HiFi+Hifiasm的技术优势,研究者随后又从“染色体构建”、“计算资源消耗”等两个方面来阐述HiFi组装基因组的特点。
(1)基于HiFi+Hifiasm组装的两份桉树基因组,几乎都达到了染色体级别。具体来说,赤桉组装出了9条完整的染色体,还有两条染色体仅由2条Contig连接而成;野桉组装出了5条完整的染色体,其余的染色体仅由3-4条Contig连接而成,且赤桉与野桉与已发表的巨桉基因组具有良好的共线性。这表明,HiFi组装可以显著降低Hi-C等辅助构建染色体技术的周期与难度。
图4 HiFi组装的野桉基因组与巨桉间的共线性分析
(2)由表2可知,组装桉树基因组,HiFi+Hifiasm运行时长最快仅需1.2h,消耗的CPU时长最低仅需1404h,仅为基于CLR+Canu的6%和1.9%,这表明HiFi+Hifiasm运行时间快,计算资源消耗少。
表2 不同测序模式下桉树基因组组装消耗IT资源比对
总结
随着千种药用植物、百万种真核生物测序计划的陆续启动,科研人员急需一套标准的流程来快速、准确地生成高质量的参考基因组。本研究基于HiFi+Hifiasm构建的LeafGo流程,可在7天内完成植物从叶片到基因组的转变,将极大的促进植物基因组学的快速发展。随着测序技术的进步与组装软件的更新,LeafGo流程将会变得更快更准确!
菲沙基因拥有稳定的HiFi产出、丰富的HiFi组装与Hi-C挂载经验,选择菲沙,我们将助力您基因组研究永攀高峰!