茄子(Solanom melongena L.)是一种重要的园艺作物,也是仅次于马铃薯和番茄的第三大茄科作物,其全球年产量超过5400万吨。随着测序技术的发展,国内外研究学者先后公布了一系列高质量的茄子基因组,但由于茄子表型变异丰富、遗传多样性高,单一的茄子参考基因组不足以涵盖茄子种内所有的遗传变异。因此,构建茄子的泛基因组对茄子育种研究具有重要推动作用。
近日,意大利和德国科学家在the plant journal期刊上发表了题为“Improved genome assembly and pan-genome provide key insights on eggplant domestication and breeding”的研究论文,该研究构建了首个茄子核泛基因组和质体泛基因组,并基于PAV的选择性消除分析鉴定了53个与茄子驯化性状相关的候选位点,为茄子的驯化和育种研究提供了新见解。
图1 文章发表信息
研究人员首先利用Hi-C、BioNano、遗传图谱等技术将Smel v3.0的茄子参考基因组(意大利品种67/3)进行更新,获得了Scaffold N50=92.1Mb的高质量Smel v4.0版本参考基因组。随后,结合从3600份茄子中挑选出有代表性的25份材料进行二代初步组装的基因组,研究者构建了首个茄子泛基因组。该泛基因组大小为1.21Gb,包含35732个基因,其中核心基因占比为87.94%,而有1246个基因仅存在于单个茄子种质中,部分泛基因组基因显著富集在与光合作用、蛋白质合成和和ATP生物合成相关的通路中。
图2 茄子泛基因组材料选择及核心与非核心基因分析
随后,研究者组装了26个茄子的叶绿体基因组,同时结合已发表的6个叶绿体基因组,应用DNAsp 6进行了茄子叶绿体泛基因组的构建,共鉴定到154743个不变和449个可变的位点,总的SNP数为343个。进一步计算叶绿体的核苷酸多态性(Pi),发现其平均值非常低(0.00039),仅有5个区域的Pi大于0.002。此外,研究者还鉴定了茄子叶绿体泛基因组中的SSRs,其大多都是A/T的单核苷酸重复。总的来说,茄子叶绿体基因组比较保守,且编码区的变异性和重复序列比例都低于非编码区。
图3 茄子叶绿体基因组构建及其核苷酸多态性(Pi)分析
以构建的茄子泛基因组为reference,研究者在26份茄子种质中鉴定到了1500多万个SNP,随后基于SNP和PAV分别进行了系统进化树和主成分分析,结果都显示茄子种质可以分为两类,一类是栽培茄子,一类是野生茄子,这也表明了基于SNP和PAV群体分析的一致性。
茄子在长期的进化中形成了许多独特的表型,例如果实有无花色素、刺的有无、果实的形状(长、椭圆、圆形)等,研究者利用ROD、XP-CLR两个指标对上述五个性状分组进行了选择性消除分析,并结合已有的QTL数据,共鉴定了53个与上述性状相关的位点。包括与花青素合成相关的基因(FLS、CHI、ANR)、控制刺的有无相关基因(Gl1、GIS2)、与果实形状相关的基因(FAS、LC、IQD、SOV、CSR)等。
图4 茄子群体结构分析
总之,该研究组装了更高质量的茄子基因组,并构建了首个茄子核泛基因组和质体泛基因组,加深了茄子基因组的相关研究;而茄子主要农艺性状的选择性扫描和候选基因的鉴定为初步了解这一重要蔬菜品种驯化和选择的基因组事件奠定了基础。