麂属动物是反刍亚目、鹿科、麂亚科的一类小型哺乳动物,属内各物种间染色体数目差异巨大。细胞遗传学研究表明,麂属动物多变的染色体数目和核型是由鹿科祖先染色体(2n=70)反复串联融合而来,但这样反复串联融合的分子机制一直是谜团。另外,由于常染色体和性染色体发生融合,伴随转位和倒位等染色体变异事件,黑麂进化出一对新性染色体(neo-sex chromosomes),这是哺乳动物中迄今发现的最年轻的新性染色体,使其成为研究哺乳动物性染色体进化的难得模型。
2021年11月25日,西北工业大学、中科院动物研究所联合菲沙基因等国内多家科研机构合作完成的研究成果以题为“Molecular mechanisms and topological consequences of drastic chromosomal rearrangements of muntjac deer”在线发表于国际著名期刊Nature Communications。该研究组装出了具有祖先核型的多种麂属物种和獐子的高质量染色体水平基因组,重建了从麂种祖先到现存物种的染色体融合的详细过程,解析了麂种进化过程中大染色体融合事件的分子基础,并基于获得的大量Hi-C数据探讨了染色体融合对染色质三维结构的影响。该研究提供了对物种进化历史、染色体融合的潜在分子基础以及麂鹿大染色体重排的拓扑结果的视角。菲沙基因参与承担了该研究中的Hi-C 3D进化相关工作。
研究结果
1、麂属种基因组组装、注释和比较基因组分析
研究者首先利用高覆盖度的长读长和短读长测序数据结合Hi-C数据,组装了具有祖先核型的獐子(H. inermis;也称中国水鹿,河麂,2n=70),小麂(M. reevesi;2n=46),雌性和雄性黑麂(M. crinifrons;2n=8/9)的染色体水平基因组,以及黑麂最近缘物种贡山麂(M. gongshanensis;2n=8/9)的草图基因组,在每个基因组中注释得到40%~44%的重复序列,以及约21000个蛋白编码基因。结合已有的赤麂(M. muntjak vaginalis)基因组草图,经过比较基因组分析发现黑麂和贡山麂在1.44百万年前产生分化,全基因组比对分析了不同麂属种的染色体重排事件,结果证实染色体融合是导致麂染色体数目在种间剧烈变化的主要重排类型。
图1 麂属动物的系统发育、种群统计、分布和共线性分析
2、麂属动物染色体融合对基因组三维结构的影响
该研究选取獐子、小麂和黑麂这三种染色体数目呈阶梯变化的物种,从多个层级比较了它们的基因组三维构象,发现尽管染色体数目差异巨大,但是它们在染色体区室(compartment A/B)层面相差不大,拓扑相关结构域(TAD)受到染色体融合的影响也较小,TAD在物种间的保守水平主要随物种间分歧时间的增大而减小。与小麂相比,黑麂融合后的染色体增加了很多长距离的显著互作,它们可能在维持融合后大染色体在细胞核内的紧缩结构上起作用。另外,黑麂中还随着融合事件建立了很多新的跨融合位点显著互作,结合对这些显著互作位点相关基因的分析,发现这些显著互作可能除了维持染色体三维结构外,还具有一定的物种特异性状相关的功能作用。
图2 麂属动物染色体融合的三维结构基础
3、麂属动物染色体融合的分子基础
研究者通过验证两种假设来解析染色体融合的分子机制:
第一种假设是某些麂属特异性重复序列通过非等位基因同源重组介导串联融合。通过对小麂、黑麂和贡山麂以及近缘物种麋鹿(Elaphurus davidianus;2n=68)的三代测序长reads数据进行分析和比较,发现一个复杂的重复序列结构可能介导了染色体的不断融合。该重复序列结构包含一个短的端粒类似序列,两侧有回文序列,再两边分别是鹿科I类和IV类卫星序列。回文序列是基因组中的脆性位点,该处发生DNA断裂后,一条祖先染色体的短端粒类似序列很可能会与另一条祖先染色体的端粒序列发生非等位的同源重组,从而导致了两条祖先染色体的融合。
第二种假设是与调节基因组稳定性相关的基因突变可能有助于麂属动物染色体的快速进化。研究者通过分析快速进化基因(REGs)和正向选择基因(PSGs),发现在黑麂、贡山麂和赤麂这三种发生了大量染色体融合的麂属物种中有很多与染色体稳定相关的基因发生了快速进化或受到正选择。这些基因的改变可能与重复序列结构共同促进了麂属物种的染色体融合,也可能对稳定融合后的大染色体具有作用。
图3 麂属动物染色体融合的分子基础
4、黑麂新性染色体的进化
该研究组装出了黑麂的整条neo-X和neo-Y染色体,确定了neo-Y倒位区的大小为375Mb且同源neo-X区域的大小为378Mb。通过比对neo-X和neo-Y倒位区的多种序列特征,发现形成于约1.5百万年前的neo-Y有了初步的退化且慢于果蝇(Drosophila miranda)。尽管在neo-Y区发现了有限的序列退化,研究者利用多个黑麂个体和贡山麂个体的重测序数据得到了neo-Y倒位区的大量(66.46%)雄性特有变异,例如更高密度的SNP和小插入删除(indels),并且基于这些雄性特有变异的密度分布校正了已有细胞遗传学数据提出的neo-Y染色体上两次倒位的顺序。研究者进一步分析这些雄性特有变异,还发现它们导致了neo-Y倒位区内高密度的氨基酸非同义替换以及破坏了107个基因的开放阅读框。
图4 黑麂新性染色体的进化
最后,通过比较雌性和雄性黑麂的染色体三维构象,发现在neo-Y倒位区聚集了大量染色体区室的转变(compartment switch),结合该区域内基因分析发现这些转变已经影响了其内功能基因和封闭基因的表达水平。相比之下,TADs则在neo-Y倒位区内仍然保持稳定。这些结果提示Y染色体的基因表达调控退化可能是由于大尺度染色质结构的改变造成的。
总 结
该研究利用三代和二代测序数据结合Hi-C数据组装了具有祖先核型的獐子,小麂,雌性和雄性黑麂的染色体水平基因组,以及黑麂最近缘物种贡山麂的草图基因组,联合麂属动物基因组三维构象数据分析,深入研究了麂属物种染色体进化的结构基础和分子机制,以及剧烈的染色体进化对基因组三维构象的影响,同时还从多个方面分析了黑麂新性染色体的进化。
中科院动物研究所魏辅文院士,西北工业大学王文教授,浙江大学周琦教授为本文的共同通讯作者;西北工业大学殷源博士和中科院动物研究所樊惠中助理研究员等为本文第一作者,菲沙基因周帆、刘琳署名参与了本研究。该研究得到了国家自然科学基金,西北工业大学专项经费,中科院战略性先导B,钱江源国家公园、生态环境部生物多样性调查、观测与评估等项目的支持。