技术背景
基于二代测序技术的基因组目标区域测序已广泛应用于遗传病和癌症研究中,但由于核心技术受限(测序长度小于300bp),对结构变异(SV)、动态突变、重复序列区域变异检测以及高复杂高多态性区域(HLA、BCR、TCR)等分析具有局限性。以PacBio和ONT为代表的三代测序技术突破了技术限制(平均测序长度可达到20kb以上),但因成本相对较高阻碍其广泛应用。为了降低测序成本,三代目标区域捕获测序成为一种解决方案,通过将基因组上感兴趣的区域设计特异性探针(互补序列),然后与基因组DNA序列杂交富集后进行测序。随着PacBio Revio测序平台推出,芯片上的零模波导孔(ZMW)数量从原来的800万增加到2500万,HiFi数据通量增加15倍,价格将显著的降低,也将进一步推动三代测序在医学研究上得到更加广泛的应用。
技术优势
三代目标区域捕获测序,不仅保留了长读长的测序优势,而且可以针对感兴趣的区域以高性价比方式进行测序。测序得到的HiFi reads准确度达到Q20,能精准检测SNV、InDel、SV和CNV等全类型变异的同时进行单倍体分型分析。目前三代目标区域捕获测序技术已被应用于罕见病、肿瘤、HLA分型、复杂疾病、药物基因组以及外源DNA片段插入等研究中。
目标区域富集的方法一般分为液相探针捕获、CRISPR/Cas9靶向捕获和长片段PCR扩增捕获三大类,优劣总结如下:
实施方案
目标区域捕获过程采用的是液相探针捕获方法,基于菲沙医学自主设计开发的菲沙-NGS-泛实体瘤39基因panel探针进行捕获。实验流程操作较复杂,长片段扩增需要高保真酶,保证变异检测结果更加全面准确。建库流程如下:
测试数据展示
1、数据质控
使用PacBio开发的SMRT Link软件(v11.0)用于数据质控,将subreads转换成HiFi reads,统计HiFi reads基本信息,结果如下:
HiFi reads长度分布图如下:
2、数据比对
使用minimap2软件将HiFi reads比对到参考基因组(hg19)上,统计比对率、捕获效率、平均深度和覆盖度,结果如下:
可以看到捕获效率达到56.8%,效果与二代捕获相当,目标区域覆盖度超过99%。在HiFi数据量1.2G的情况下,平均深度近500X。
3、单体型分析
输入比对文件和VCF文件,使用whatshap软件进行分型,得到分型后的bam文件,然后导入IGV,可以得到两个单体型结果(Haplotype1和Haplotype2),很好的区分了一对等位基因上各自的变异组合情况,结果示例如下:
4、SV分析
使用Sniffles软件分析结构变异(SV),统计结构变异的类型和长度分布,结果示例如下:
总 结
借助最新三代测序PacBio Revio平台的发布,菲沙基因率先推出了基于长片段目标区域捕获的技术产品,该产品进一步降低了三代测序医学应用的费用门槛,以期将先进的测序技术更多的普及到医学科研应用当中。菲沙基因作为三代测序技术的领跑者,一直在不断创新、不断突破。基于自身在三代测序领域的深厚沉淀,为广大科研工作者和临床医生提供最新的测序技术服务。