意见与建议
首页市场动态市场资讯 > 转录组研究新宠——Iso-seq
详细信息

转录组研究新宠——Iso-seq

浏览次数: 日期:2016年7月1日 15:08

转录组测序(RNA-seq)在过去的5年里得到广泛应用,已然成为了研究基因表达的必备工具。基于二代测序,RNA-seq可以快速获得特异组织特定状态下的转录本表达信息和序列信息,该技术使我们对细胞发育及其调控机制的理解更加深刻。随着研究的深入,普通RNA-seq片段较短、需要组装的缺陷逐渐暴露在科研人员面前,而基于PacBio SMRT测序技术的全长转录组测序(Iso-seq)为这些问题的解决提供了可能。

基因产生的转录本长度不一,并且在转录本产生的过程中存在可变剪切,已有的研究表明可变剪切是一种对生物功能产生深远影响的调控机制。普通RNA-seq采用二代测序平台,得到的片段不超过300bp,需要通过算法组装得到转录本信息。这种测序方式尽管可以准确地发现剪切位点,但是很难正确地推断出剪切体实际的组合方式。PacBio测序则不同,其平均测序片段长度可达10Kb,足以覆盖转录本全长,因此测序结果可以直接用于分析可变剪切产生的同源异构体。

Iso-seq那么好,我们一起去看看!

单分子长片段测序揭示玉米转录组复杂性

Doi:10.1038/ncomms11708

研究背景:《Nature Communications》6月24号刊发了一篇全长转录组文章,揭示了重要经济作物玉米的复杂转录组。以前玉米转录组的研究使用的基本都是二代测序平台,其短读长限制了mRNA转录本完整结构的研究。全长转录本对基因注释、可变剪切、新基因发现等各个方面的研究都有帮助,因此使用单分子长片段测序方法对于揭示转录本的复杂性具有重大的意义。

研究方法:

(1)材料选取

        为了保证转录本同源异构体(isoform)的覆盖度,研究人员选取了不同发育时期的6个部位进行Iso-seq,这些组织包括根、花粉、胚、胚乳、幼穗和幼雄花穗。

(2)测序方法

为了准确获取不同部位转录本信息,研究人员使用了Barcode进行区分,然后再分片段进行上机PacBio测序。

A.     6种组织分别提取RNA,扩增前加入不同的Barcode;

B.      引入Barcode后的样品混合进行片段选择,构建6个文库(<1, 1–2, 2–3, 3–5, 4–6 和>5 kb);

C.      PacBio RS II平台结合P6-C4试剂测序,总共47个cell。

(3)数据筛选

      测序总计产生370多万条reads,长度在300-8,000bp。以barcode和polyA尾为筛选标准,两者都含有的read被认定为全长转录本,共筛选得到150多万条全长转录本。

(4)信息分析

      根据测序结果分析新转录本、isoform和融合基因,结合二代测序发现新的lncRNA,结合已有的甲基化信息分析同源异构体的甲基化。

研究结果:

(1)isoform检测与鉴定

 通过全长转录本基因组比对得到111,151条非冗余转录本同源异构体,这些转录本对应26,946个基因。分析isoforms,研究人员发现其中829个属于转座子元件,剩下的覆盖了玉米RefGen_v3参考基因组70%的基因。本研究从已知基因中发现62,547个新isoform,占全部的57%;从2,253个新基因中发现2,803(3%)个新isoform。统计最终的数据统计结果,SMRT测序产生的转录本长度明显超过当前B73基因注释结果。

(2)组织特异性isoform和可变剪切模型

 分别统计分析6种不同组装的isoform,发现花粉拥有比例最高的组织特异性isoform(61.3%),其次是胚(49.2%)和胚乳(46.7%)。GO分析表明这些组织特异性的isoform与各组装特定的分子功能相关。针对目前5种主要的可变剪切模型(内含子保留、外显子跳跃、3’受体选择、5’供体选择和外显子互斥)对各组织isoform进行分类,可以发现不同组织其可变剪切类型所占比例具有加大差别。

(3)LncRNA鉴定

为了从PacBio数据中鉴定出LncRNA,研究人员构建了PLEK模型,最终鉴定出878个候选LncRNA。其中11个属于已发现LncRNA,剩余867个属于新发现的高置信度LncRNA,其平均长度达到1.1Kb,该结果明显优于二代测序结果(平均长度463bp)。

(4)融合基因鉴定

       在本研究中,共鉴定1,430个融合转录本,其中134个融合能够在Illumina测序数据中找到。融合基因也具有组织特异性,并且更倾向于发生在染色体间,尤其是靠近染色体末端的位置。随机抽取7个可能的融合基因进行RT-PCR和Sanger测序,其中5个(71%)可以得到确认。

研究结论:

      单分子长片段测序极大地改善了现有的玉米基因模型,证明了SMRT测序具有弥补短片段测序在转录本分类和质量上不足的能力。本研究可以通过新isoform、新基因和新LncRNA来提高玉米基因组组装和注释的结果。

参考文献:

1. Wang B, Tseng E, Regulski M, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communications, 2016, 7.

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: