详细信息

二+三混合组装策略揭秘中草药“甘草”全基因组序列

日期:2016年11月4日 10:04

甘草是一种豆科植物,广泛应用于各种中药中,是重要的中药原料。它具有改善肝功能、治疗消化性溃疡、抗炎症及止疼止咳等多种功效。甘草根部富含的主要成分甘草甜素的甜度是砂糖的150倍,可用作非糖基甜味料,具有预防代谢综合征的作用。同时甘草也是医药、化妆品、天然甜味料的重要原料,需求量极大。对其进行基因组测序,不但可根据其基因组信息高效育种,还可对有效药用成分甘草甜素遗传基因进行深入研究,以期实现生物合成。

——摘自《科技日报》

材料选择

研究人员选用乌拉尔甘草(Glycyrrhiza uralensis)叶片作为研究材料进行基因组组装。经过显微观察,该物种为二倍体(2n=16)。经过流式细胞仪分析,乌拉尔甘草的基因组大小为400.95±4 Mb。

 

图1. 甘草体细胞染色体观察和基因组大小分析

测序策略

研究人员采用Illumina短片段结合PacBio长片段的方法(2+3)进行基因组测序,测序结果如下表所示:

表1. 测序数据统计

组装方法

研究人员采用了典型的二三代混合组装思路,即先使用二代测序数据对甘草基因组进行了初步组装(Pair-end + Mate pair),而后使用矫正的PacBio数据进行Gap filling和组装升级。组装思路如下图所示:

图2. 甘草基因组组装思路

组装结果

研究人员最终组装得到甘草基因组大小为379 Mb(Scaffold >1 kb),scaffold N50为109 kb,contig数目为72,148。通过数据库比对,共预测到34,445个基因位点和38,135个基因模型。深入研究发现,三种异黄酮生物合成相关基因(CYP93C、HI4OMT、7-IOMT)形成的基因簇位于甘草基因组的同一条scaffold上,并且这些基因在物种间是保守存在的。

表2. 甘草基因组组装结果

小编手记

中药是我们的国粹,是世界医药学的重要组成部分。对中药材基因组的研究,可以把几千年的传统中药材提高到时代的先进水平。PacBio测序技术解决了二代测序高GC区域无法准确测定、高重复序列无法跨越、海量短序列组装困难等问题。以PBJelly为代表的“2+3”混合组装算法已经得到广泛使用。随着PacBio测序成本的降低,未来以纯三代测序为主,以Bionano和Hi-C为辅的新组装技术势必带来新的突破,“白金级基因组”将不再是梦想。

 

参考文献

Mochida, Keiichi, Sakurai, Tetsuya, Seki, Hikaru, et al. Draft genome assembly and annotation of Glycyrrhiza uralensis, a medicinal legume[J]. The Plant Journal, 2016.

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: