甘蔗(Saccharum officinarum),作为全球按吨位计算最大规模的农作物,对历史、贸易和地缘政治产生了深远影响,目前占全球糖产量的80%。尽管传统育种方法已经培育出适应新环境和病原体的品种,但糖分产量的提高近期已陷入停滞。这可能是由于育种群体内遗传多样性有限、育种周期长,以及其基因组复杂性所致。而通过解析甘蔗复杂的基因组,可为其产量提升和新品种选育提供切实帮助。
3月27日,国际顶级期刊Nature在线发表了题为“The complex polyploid genome architecture of sugarcane”的研究论文。该研究通过综合应用多种测序技术和生物信息学方法,克服了甘蔗基因组的复杂性,生成了一个高度连续的栽培甘蔗基因组组装(R570)。该参考基因组不仅填补了甘蔗之前物理遗传图谱中的空白,还详细描述了与单拷贝Bru1褐锈病抗性位点相关的可能因果基因。
图1 文章发表信息
该研究选择现代广泛的杂交甘蔗品种R570进行测序,R570基因组大小与现代甘蔗品种类似(约为2C=10Gb),其核型约为2n≈6x=114,具有杂交和自交植物所有的复杂特征。
研究者利用PacBio HiFi、Illumina平台和Bionano等,结合遗传图谱和Hi-C数据,通过“主要(对R570中独特单倍型的完整表示)”和“备用(代表几乎相同的额外单倍型)”两种方式组装,研究者构建了8.72Gb的甘蔗基因组(因12.5%的自交系数而缺少1.25Gb的组装),涵盖了大约12个染色体拷贝。结合同源注释、转录组注释、从头注释,研究者预测了194,593个编码序列和105,138个可变剪接转录本。与之前的单倍型基因组相比,新构建的R570基因组存在六个同源基因拷贝,反映了预期12倍倍性的一半。总之,本研究组装了迄今为止最完整的栽培甘蔗基因组。
图2 R570的杂交历史和核型特征
进一步,研究者通过对甘蔗品种R570的基因组进行深入分析,揭示了其复杂的基因组架构。R570基因组是由栽培种和野生种杂交而成的多倍体结构,大约包含12个染色体拷贝。研究发现,R570基因组中约73%的序列来源于栽培种Saccharum officinarum,而27%来源于野生种Saccharum spontaneum。尽管两个祖先物种的染色体数目和基本结构存在差异,但在R570中,这些染色体大多数保持共线并具有序列同源性,这有助于种间重组。研究还发现了13个异种重组染色体,这些染色体包含了来自两个祖先基因组的多样性。此外,研究还利用高精度的PacBio HiFi读取来鉴定基因组中的复制序列和单倍型结构,发现大约一半的基因组序列在多个拷贝间是完全相同的,而另一半则包含足够的序列变异,能够通过PacBio读取进行独特单倍型的精确比对。这些发现为理解甘蔗的遗传多样性和育种提供了宝贵的信息。
图3 R570甘蔗品种基因组特征
最后,研究者探讨了R570基因组对甘蔗育种的贡献。研究者特别关注了甘蔗品种R570基因组中与重要农艺性状相关的序列变异和拷贝数变异。研究人员通过比较栽培种和野生种的贡献,能够将基因模型分配给特定的祖先,并识别出与病害抗性和糖分含量相关的候选基因。此外,研究还发现了多个结构变异,这些变异可能会阻止重组并影响有益等位基因的产生。通过详细注释R570基因组,研究人员为甘蔗育种提供了重要的分子目标,这将有助于加速甘蔗品种改良,提高其产量和适应性。
图4 Bru1候选基因位点
总之,甘蔗品种R570的多倍体基因组组装和注释是甘蔗基因组学革命的重要一步。这项工作揭示了育种实践对甘蔗基因组的影响,将甘蔗转变为糖/生物质生产工厂的复杂过程。研究强调了尽管经过多轮回交,野生种Saccharum spontaneum的基因组贡献仍然存在,这表现在抗病基因类似物(RGA)的富集和来自野生祖先的独特基因家族贡献上。R570基因组的解析为理解复杂多倍体基因组的精细结构提供了可能,并通过探索等位基因变异、拷贝数和基因存在/缺失变异,显著提高了对农艺性状遗传理解的深度。此外,通过对褐锈病抗性位点Bru1的鉴定,研究支持了一种串联激酶-假激酶(TKP)作为Bru1抗性的原因,并为未来甘蔗的生物技术改良提供了坚实的基础。