意见与建议
首页市场动态市场资讯 > 先定一个小目标,构建白金级参考基因组
详细信息

先定一个小目标,构建白金级参考基因组

日期:2016年9月9日 15:06

高质量的参考基因组一直以来都是科研领域追求的目标,sanger测序法的出现拉开了人类基因组计划的序幕,为我们带来了基因测序的金标准,然而其高成本和低通量极大限制了物种基因组信息的挖掘。二代测序技术成功解决了成本和通量上的问题,掀起了基因组领域的第二次浪潮,各种基因组计划相继出炉, “5000种昆虫基因组(i5k)计划”,“万种脊椎动物基因组(Genome 10k)”计划,“国际千人基因组计划”、“英国万人基因组计划”……研究人员迫切的想对物种的基因组进行深入的测序研究,然而,我们现有的基因组真的是我们想要的高质量基因组吗?

(左图代表现有大部分基因组组装效果,右图代表提升后的基因组组装效果)

基因组组装结果的质量,用得比较多的词是“draft genome”和“finished genome”( 或“complete genome”)。draft genome(“基因组草图”)往往呈片段化,N50比较小,基因组中存在很多gap(用“N”表示),很多基因以片段存在,也可能缺失很多基因。而complete genome(“基因组完成图”),顾名思义,是完整的。然而到目前为止,受到物种本身的特点(基因组大小、杂合度、倍性)以及现有研究技术的限制,真正实现基因组完成图的只有一些微生物基因组,多细胞真核生物的基因组很少是真正完整的。因此,目前绝大多数的基因组都属于基因组草图,即draft genome,基因组中存在严重缺陷。

2011年英国基因组科学家Ewan Birney(European Bioinformatics Institute)首次在Nature Methods的一篇评论中提出了白金级参考基因组:“It is clear that a ‘platinum-grade’ error-free, complete sequence of one individual’s genome is currently both technologically unfeasible and too costly。”美国基因组科学家Evan Eichler(University of Washington)课题组发现,BGI首次利用Illumina测序结果组装得到的人基因组具有很多错误,并在Nature Methods撰文指出其中的错误。Ewan Birney对此做出了中肯的评论,认为该组装结果虽然有很多错误,仍然是一个很好的开端,肯定会逐步改善。同时Ewan Birney还提出白金级基因组(platinum-grade genome)是基因组组装的终极目标。

2015年,Evan Eichler等人再次在Nature Reviews Genetics的综述文章中对白金级基因组下了一个定义:“The goal of this US National Human Genome Research Institute (NHGRI) initiative is to generate new, high-quality reference genomes that are as accurate as (‘gold’), or are more complete and accurate than (‘platinum’), the current human reference genome. ”由此可见,与现在版本的人类基因组质量相同的是“黄金级”,而更高则是“白金级”。

因此研究人员开始进一步思考,究竟如何才能获得“白金级”基因组?2012年Monya Baker在Nature Methods文章中指出:评价一个基因组的好坏最常见的评判标准是N50,但是这一标准并不能很精确的反应组装基因组的质量,例如玻璃海鞘(Ciona intestinalis)首次组装scaffold N50达到234kb,二次组装将N50提升了10倍,然而却由于算法中过滤了大量重复序列,导致重要的保守基因和序列丢失。由此说明,单独使用一种组装产生的结果往往会缺乏与之比较的参数进行修正,需要同时使用多种方法进行组装才能使组装达到金标准。Evan Eichler也曾在文中提出构建白金级基因组需要利用多种测序方法,还要结合传统的方法,比如基于BAC的测序,以便解决复杂区域。

近年来随着基因组研究技术不断升级创新,以PacBio SMRT测序为代表的三代测序技术凭借超长读长成功解决了以往二代测序的片段化问题,BioNano酶切光学图谱技术有效辅助了基因组组装中的片段scaffolding,而三维基因组技术Hi-C在基因组组装中的应用也取得了惊人的效果,实现了基因组染色体水平的组装。相信不久的将来,以PacBio+BioNano+Hi-C为主的技术组合一定会带领基因组组装进入“白金级”时代。

 

参考文献

1. Birney E. Assemblies: the good, the bad, the ugly[J]. Nature methods, 2011, 8(1): 59-60.

2. Baker M. De novo genome assembly: what every biologist should know[J]. Nature methods, 2012, 9(4): 333.

3. Chaisson M J P, Wilson R K, Eichler E E. Genetic variation and the de novo assembly of human genomes[J]. Nature Reviews Genetics, 2015.

文献下载请点击

所属类别: 市场资讯

该资讯的关键词为: