意见与建议
首页市场动态市场资讯 > 橡胶树基因组最新组装结果揭示史前四倍体证据
详细信息

橡胶树基因组最新组装结果揭示史前四倍体证据

作者:frasergen日期:2017年2月24日 11:48

前言

橡胶树(Hevea brasiliensis)起源于南美洲亚马逊河热带雨林,能产生高质量的聚异戊二烯。在2500种产乳胶的植物中,橡胶树是唯一一种用于商业化生产天然橡胶的植物,其用量占到全世界橡胶总用量的98%,DNA遗传标记为育种学家加速优化植株的选择提供了可替代的策略。目前橡胶树的基因组草图组装得非常片段化,含有超过100万个contigs,N50大小只有2.9 kb。近期,泰国橡胶树研究中心的科学家对橡胶树基因组进行了基因组研究,采用“二+三代”混合测序组装的方法,大幅度的提升了橡胶树基因组草图的精度,并揭示出其在遗传和进化过程中发生了全基因组复制事件,该成果于2017年02月02日发表在Scientific Reports上。

材料选取

橡胶树克隆株BPM24,选取顶部嫩枝的叶片组织,提取基因组DNA;

测序策略

分别使用三个测序平台:Roche 454 GS FLX+,Illumina HiSeq 2000 和PacBio RSII,构建了350 bp~12 kb共10个文库,测序深度分别为3.4X,37.8X 和26.8X 。

测序结果:

基因组大小为1.25 Gb,scaffold N50达到96.8 kb。

组装方法

研究者使用SOAPdenovo v1.05将Illumina paired-end reads组装成contigs, 使用CD-HIT进行cluster,再使用Newbler 2.8 software将过滤后的454 reads与Illumina contigs组装起来,然后使用DBG2OLC assembler整合PacBio的数据,最后使用Chicago提升组装效果,组装数据如下:

基因组重复序列高达69.2%

作者使用之前已发表的SNP遗传图谱数据来锚定橡胶树的基因组,发现能匹配上的数据只占24.7%,推测原因是橡胶树中存在大量的重复序列。使用RepeatModelerv 1.0.8RepeatMasker v4.0.6对重复序列进行鉴定和注释,发现重复序列占到69.2%,其中逆转座子占到了大约一半,51.55%的序列是长末端重复序列(LTR)。相比其它几个相近物种,橡胶树中的LTR比例明显更高,可能是在物种分化过程中橡胶树中的LTR序列得到了大量的扩增。

图1. 大戟科基因组重复元件组成

橡胶树基因组中含大量抗性相关基因

使用OrthoMCL将橡胶树的基因组与其它物种做比较基因组分析, 橡胶树与同一科内的几个物种比较,有934个特异基因。与分别代表单子叶植物、双子叶植物和绿藻的亚麻纤维卷,拟南芥和衣藻的基因组相比,橡胶树与它们的共有基因家族有3529个。进一步分析橡胶树的病原体免疫系统,发现橡胶树基因组中含有大量病原体相关模式识别的受体基因(PRR),与疾病抗性相关的表达基因明显多于其它邻近物种。

    

图2. 橡胶树与其他植物共有和特有基因

 

图3. 橡胶树于其他物种中R-gene分布比较

全基因组复制事件揭示史前四倍化证据

基于蛋白编码序列的相似性,对橡胶树的18个连锁群进行同源基因共线性分析,鉴定出2951个直系同源基因,共包含164个共线性区块(Identified by MCScanX and plotted with CIRCOS)。从图中可以看出,有9对基因之间的共线性非常好,表明橡胶树基因组经历了加倍事件。通过比较橡胶树和木薯的宏观共线性的保守程度,作者认为四倍体化事件发生在三叶橡胶树与木薯分化之前。

   图4. 橡胶树18个连锁群共线性分析

 

首次揭示橡胶树可变剪切事件

利用PacBio测序对橡胶树幼叶中提取的RNA进行全长转录组序列,构建了1-2kb、2-3kb和3-6kb三个文库。使用SpliceGrapher软件识别转录本变异信息。结果检测到1481个转录本来自单外显子基因,10,303个来自多外显子基因,共鉴定出636个可变剪切事件,其中内含子保留事件(intron retention, IR)发生率最高,为41%,与玉米、高粱等植物种类所含的可变剪切类型分布相似。

  

 

参考文献:

Wirulda Pootakham et al., De novo hybrid assembly of the rubber tree genome reveals evidence of paleotetraploidy in Hevea species. 2017,Sci Rep7:41457.

所属类别: 市场资讯

该资讯的关键词为: