意见与建议
首页市场动态市场资讯 > 我说微生物,你扔给我整个大观园——来自全长16S序列的高分辨率微生物群落进化分析
详细信息

我说微生物,你扔给我整个大观园——来自全长16S序列的高分辨率微生物群落进化分析

日期:2016年5月16日 15:10

导语

地球演化,岁月变迁,微生物是自然界中古老而浩瀚的存在,是无处不在的力量,“人以群分,物以类聚”,大大大世界里蕴含的小小小微生物也同样殊途同归趋同进化,我们得知了微生物的存在,并在实验室中培养了我们研究的种群。然而自然界中存在的大量无法培养的微生物,那些被称之为“生命的暗物质”,宏基因组研究便源自于对这神秘的“暗物质”进行破译。

16s rRNA已经成为微生物进化分析中最广泛使用的标记,可以用来对新细菌和古菌进行分类。近20年间,在微生物群落分析研究中,高通量短序列16s扩增子测序方法已经取代了金标准的Sanger测序方法。Sanger测序能够提供接近全长(FL)的16s rRNA片段,但是一代测序的成本高且通量小。而以Illumina为代表的二代测序技术,成本更低更适合大规模测序,但是这种测序技术在宏基因组研究中的广泛应用却常常是以牺牲质量为代价的。

“短读长测序技术(454Illumina)产生的低精度参考序列、嵌合序列和rRNA基因部分序列,降低了系统分类的分辨率,导致微生物群落错误分类。”只有全长(FL)或接近全长的16s rRNA基因序列被证明足以准确的构建系统进化树。由于一代和二代测序技术的种种限制,美国能源部联合基因组研究中心的研究人员们将目光投向三代测序,近期发表在ISME Journal 上的一篇文章“High-resolution phylogenetic microbial community profiling”中展示了一种用于微生物分析的SMRT测序新方法,对全长16s rRNA基因序列进行测序,证明该方法与短读长测序相比,可以得到更加准确的系统分类信息。

1)模拟群落验证SMRT测序

研究人员使用含有23个细菌参考基因组的模拟群落得到一系列PacBio 16s rRNA基因序列数据,并将SMRT技术产生的全长 16s rRNA基因序列称为PhyloTags5个模拟群落的高质量PhyloTags数据成功分成22OTU,每个OTU16s rRNA基因相似度高于97%。通过质量分选出来的质量最好的PhyloTag对模拟基因组16s rRNA基因的相似度是99.5%。另外,5PhyloTag技术重复的相关性非常好,相互之间的相关系数均达到96%以上,并且与鸟枪法打断的meta序列具有很强相关性。在模拟群落实验中,PhyloTags的结果可以与传统iTag测序结果相媲美。

2Sakinaw湖水菌群分析

Sakinaw湖含有丰富的微生物类群,研究人员选取8个不同深度的湖水进行采样,分别对这些样本进行PhyloTagV4 iTag分析。结果表明,V4 iTags数据中有0.2-4.1%的微生物在门水平上无法区分,而PhyloTags则能在门水平上将这些微生物完全区分。比较各个深度的PhyloTagV4 iTag数据,发现深度在50-120m时,两者在门水平上的微生物分类差异明显。在环境样本中,短读长测序数据在复杂群类区分中失去优势,而PhyloTags则能在属水平上对菌群进行区分。

3PhyloTags提高菌群进化分类的分辨率

为了评估扩增子长度对群体分析的影响,研究人员随机抽取了Sakinaw样本中的1818PacBio FL序列和它们对应的二代测序产生的V4区域序列进行成组比较。结果表明,在多个实例中相同的序列对表现出来不同的鉴定结果,产生这些结果的原因是16s rRNA基因的突变位点分布并不均匀,高估或低估这些突变都将影响微生物群落的分类。

4PacBio SMRT测序在微生物群落分析中的优势

l  PacBio平台测序产生PhyloTags的过程中不需要扩增,相较于其他测序平台降低了测序平台的特异性偏差。

l  PacBio平台测序产生的PhyloTags具有超高的一致准确性,并且能够真实反映微生物的高GC/GC区,不会产生扩增偏好性。

l  PacBio公司正在努力改进提高测序正确率,目前的P6-C4试剂的平均正确率可达86%以上,读长可达12Kb。随着时间的推移,使用PacBio测序的16s指标将逐渐达到Sanger扩增子的水平。

小编手记:

地球上存在着约10亿种微生物,包括病毒、古菌、细菌等等,这其中大部分与人类生存和生活密切相关,然而到目前为止我们了解的微生物资源只有不到1%,因此如何更大程度的挖掘微生物资源一直都是研究人员关注的问题。随着高通量测序技术的快速发展,我们由高成本低通量的Sanger测序转移到低成本高通量的Illumina二代测序,随之掀起了一股微生物基因组研究热潮,201510月发表在三大权威期刊(NatureScienceCell)上有关微生物研究的文章高达10余篇,由此可见微生物领域的研究需求已经由早期的0 Gap基因组完成图进一步拓展到环境微生物种群分类并组装出不同类别的微生物基因组完成图,而PacBio三代测序的出现恰好解决了这两方面问题。本文利用PacBio SMRT测序技术成功测定了全长16s rRNA序列,并在Sakinaw湖水菌群中进行验证,结果显示不同水下深度时,三代测序对细菌群落的分类达到门水平,在环境样本中对于复杂群落更是分类到属水平,而二代测序无法实现该分类。PacBio测序平均长度为15kb16s rRNA全长序列约1.5kb,因此测序中可以产生高精度的CCS序列读取全长的16s rRNA,得到更高分辨率的分类结果,同时借助于超长的读长特点,利用三代测序进行宏基因组测序时能同时对群落分类并得到较好的基因组组装结果。 

 

参考文献

Singer E, Bushnell B, Coleman-Derr D, et al. High-resolution phylogenetic microbial community profiling[J]. The ISME journal, 2016.

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为:全长基因组测序  16s rRNA  PACBIO  菲沙基因  微生物