Iso-seq的最大优势是长度长和高准确率,长度长是其对于二代测序技术最大的优势;无须拼接、直接到全长的转录本集;而高准确率则是PacBio的SMRT技术,对比于同为长度长测序的ONT最大优势,通过自校正避免过高的随机误差导致的准确率下降。但是也是由于其自校正的方法会导致数据通量降低以及测序成本的上升。如何解决通量问题,无疑是摆在RNA全长测序中的关键问题。
图1.全长转录组的意义
PacBio基于MAS-seq技术进一步推出的Kinnex full-length RNA 解决方案,将会极大程度的提高全长转录组数据的产出,推动大规模的全长RNA研究。
图2.Kinnex全长RNA kit
技术原理
Kinnex 全长RNA试剂盒采用MAS-Seq方法来提高PacBio长读长测序仪的通量。MAS-Seq 是一种将cDNA分子连接成长片段的串联方法。然后,通过串联分子测序产生的 HiFi reads 经过生物信息学拆分,即可还原原始cDNA序列。这种方法能够提高通量,减少测序需求,实现经济高效的异构体测序。Kinnex全长 RNA 试剂盒以总RNA作为起始样本,输出 一个可直接用于测序的文库,与典型的Iso-Seq文库相 比,其通量最高可提高8倍。
图3.Kinnex Iso-seq原理
数据表现
根据PacBio提供的测试结果来看,Kinnex数据具有极高的数据产出和良好的数据稳定性,极大的丰富了新转录本的检出,同非Kinnex文库比较,可以发现,转录本一致性极强。
图4.Kinnex数据比较
图5.Kinnex与非Kinnex对比
菲沙基于实测数据进行了实际分析,发现基于Kinnex的数据分析,挖掘出了大量的新“结果”。
表1.HIFI数据产出(哺乳动物)
HIFI产出 |
HIFI number |
平均长度 |
N50 |
23.9G |
12.5M |
1916 |
1997 |
表2.FLNC数据产出(哺乳动物)
FLNC数据量 |
FLNC number |
平均长度 |
N50 |
16.6G |
12.1M |
1792 |
1886 |
同时进一步分析发现,存在大量新转录本的检出,且超过70%的新转录本均可在数据库被注释。
图6.超过半数新转录本检出且超过70%存在注释
应用场景
伴随着产出的提升,许多不同的应用均可产生突破;我们大体将应用汇总为三个方向,即①物种综合转录本注释;②高表达转录本的发现;③低表达转录本发现和定量。
研究目标 |
物种综合注释 |
高表达转录本发现 |
低表达转录本发现 |
举例 |
基因组注释 |
疾病队列 |
疾病与正常组比较 |
目标深度 |
5M reads/样本 |
5M reads/样本 |
10M reads/样本 |
备注 |
1.大基因组注释应适当提高样本数据量; 2.如需进一步定量研究,建议至少做3个生物学重复; 3.定量研究依然可以基于3+2方案进行。 |
菲沙基因Kinnex全长转录组(Kinnex Iso-seq)
解决方案
菲沙基因正式引进Kinnex Iso-seq解决方案,为全长转录组研究提供高效、高质量、高性价比的研究支持。尝鲜活动现已开放,新品发布也即将火热来袭。