鼢鼠是一类地下啮齿动物,起源于低地。部分群体伴随青藏高原在360万年前的隆起而迁移到高海拔地区,并且适应了低氧、高CO2的环境压力。
近日,兰州大学李克欣教授、刘建全教授,以及内布拉斯加大学Jay Storz教授的团队合作在Nat Ecol Evol(IF:16.8)以“Genomic structural variation is associated with hypoxia adaptation in high-altitude zokors.”为题发表研究成果。该研究分析六种不同海拔范围的鼢鼠(凸颅鼢鼠属)的全基因组测序数据,识别可能有助于高海拔适应的结构变异(SV)。基于高海拔物种高原鼢鼠Eospalax baileyi的染色体级基因组,该研究发现18个大倒位使这个物种与中华鼢鼠(低海拔近缘物种)区别开来。E. baileyi的EGLN1、HIF1A、HSF1和SFTPD基因内含子中的结构变异与这些基因的上调表达相关。1号染色体上的重排与染色质结构的改变相关,导致了参与低氧生理反应的关键基因的表达改变。E. baileyi中发生拷贝数扩增的多基因家族富集了自噬、HIF1信号和免疫反应。E. baileyi的肺质量显著大于其他低海拔鼢鼠物种。这些发现突出了结构变异在凸颅鼢鼠属高海拔物种的低氧适应中的关键作用。菲沙基因承担了该研究的Hi-C建库测序相关工作。
文章信息
研究思路
研究结果
1. 高海拔和低海拔鼢鼠的表型
鼢鼠属主要生活在低氧高二氧化碳的封闭地洞中,面临着极端的环境压力。凸颅鼢鼠属的六个物种具有清晰的系统发育关系,它们在青藏高原隆起后,逐渐分化为高海拔(高原鼢鼠E. baileyi,斯氏鼢鼠E. smithi)和低海拔(中华鼢鼠E. fontanierii、甘肃鼢鼠E. cansus、秦岭鼢鼠E. rufescens、罗氏鼢鼠E. rothschildi)两个支系。
凸颅鼢鼠属六种的系统进化树
该研究测量了多种凸颅鼢鼠的肺质量和体质量的关系、红细胞计数和血红蛋白浓度,发现高原鼢鼠E. baileyi相比其他鼢鼠物种具有更大的肺质量,红细胞计数和血红蛋白浓度也高于低海拔甘肃鼢鼠E. cansus和秦岭鼢鼠E. rufescens。此外,E. baileyi的红细胞计数和血红蛋白浓度随着海拔的升高而增加,与慢性低氧的适应表现相一致。
多种凸颅鼢鼠的肺质量和体质量的关系、红细胞计数和血红蛋白浓度
2. 鼢鼠的基因组进化与低氧适应
该研究采用ONT测序、Illumina测序和Hi-C挂载,组装了高原鼢鼠E. baileyi的第一个染色体级别的基因组,大小为2.47 Gb,与之前发表的高原鼢鼠基因组组装相比,质量有了显著提高。该组装基因组有31个拟染色体(2n=62),与成纤维细胞的核型分析结果一致。
通过比较基因组分析,该研究构建了9种啮齿动物的系统发育树和物种分化时间,发现E. baileyi中有469个基因家族显著扩张,1609个基因家族显著收缩,前者与低氧诱导因子信号通路、DNA损伤修复、自噬、细胞周期、硒半胱氨酸合成、嘌呤和视黄醇代谢、核分裂装置在有丝分裂中心粒的招募、免疫应答和营养功能有关,后者与细胞周期、WNT信号通路、代谢和减数分裂重组有关。此外,E. baileyi中71个特异的正选择基因与双链断裂修复、昼夜节律和泛素依赖的蛋白质分解功能相关。
E. baileyi中扩张基因家族和正选择基因的富集功能
3. 鼢鼠的基因组结构变异
基于上述六种鼢鼠的长读长测序数据,以低海拔E. fontanierii为参考,该研究鉴定了398087个结构变异(218607个缺失、168333个插入、5183个重复、5062个倒位和902个易位)并识别了各种鼢鼠的特有结构变异。六种鼢鼠146个个体的短读长重测序数据也评估了这些结构变异的频率。同时,相较于低海拔E. fontanierii,高海拔E. baileyi染色体水平的基因组中有18个长度超过1 Mb的大片段倒位:11个倒位位于或靠近染色体末端,并且大多数断点与富含端粒的区域相邻;7个倒位包含了端粒区域,表明这些倒位可能改变了端粒的位置。
六个凸颅鼢鼠属物种的结构变异(a-b),以及E. baileyi内的倒位(c中的蓝线,d中的黑色方框)
4. 高原鼢鼠的特有结构变异及其在低氧适应中的作用
该研究比较高海拔E. baileyi和低海拔E. fontanierii的RNA-seq数据,确认E. baileyi的心、肝脏、肺部中与3748个特有结构变异相关的差异表达基因,发现这些基因参与多种与低氧适应相关的生物过程,包括免疫反应、细胞粘附、心脏发育、血管发育等。进一步分析显示,海拔分布最高的E. smithi和E. baileyi中与物种特异性结构变异关联的345个基因,这些基因富集的功能也与其他高原哺乳动物的低氧适应有关;E. baileyi中EGLN1、HIF1A和HSF1内含子的倒位或缺失导致了相关基因的表达上调,双荧光素实验结果与其一致;与DNA修复和免疫相关的SFTPD、XRCC4和UVRAG中的结构变异影响了蛋白质的结构或编码序列。
内含子区域的倒位/缺失使低氧适应相关基因EGLN1、HIF1A和HSF1的表达上调
5. 三维基因组进化也可能促进低氧适应
36个大倒位断点中的7个位于基因区域,可能对相关基因的功能和表达产生影响。此外,该研究中大多数倒位断点发生在TAD边界附近,断点可能通过干扰基因/调控因子之间的相互作用影响基因的表达。
E. baileyi中1号染色体有一个50 Mb的染色体重排,该重排在四种可能的纯合或杂合基因型组合中均可观察到。该研究根据海拔高度将六种鼢鼠分为四种基因型,发现低氧适应相关的EGLN1基因在三种变异基因型(II、III和IV)通过倒位从染色体末端移动到染色体臂的中部。此外,chr1大倒位区域中的大多数基因与低氧适应、DNA损伤修复、炎症、免疫、凋亡、血小板和血管发育等功能有关。
低氧相关的EGLN1基因通过倒位从染色体末端移动到染色体臂的中部
另外,A/B compartment、TAD和loop在E. baileyi和E. fontanierii之间的重排区域中存在显著差异,表明重排可能改变了基因/调控因子之间的相互作用和表达。在一些E. baileyi特异的TADs,包含了一些与凋亡和自噬、催化胆固醇和脂质合成反应相关的基因家族,如AKR1、CYP3A等。同时,重排使得应答细胞缺氧的EGLN1、GNPAT、EXOC8、SPRTN、DISCI和TSNAX位于一个融合TAD。另外,与重排区域的TAD融合事件一致,E. baileyi中的一些TAD扩大了范围,相互作用距离也显著延伸。
A/B compartment、TADs和loop在E. baileyi和E. fontanierii之间的重排区域存在差异
最后,该研究确定高原鼢鼠基因组中的小倒位(<1 Mb)和大倒位(>1 Mb)的形成机制。小倒位主要由LINE-1转座子的逆转录插入引起,LINE-1转座子的逆转录是高原鼢鼠染色体进化的重要机制。大倒位主要由非同源重组(NAHR)介导,这与鹿鼠的倒位模式一致,并且重复序列富集的区域更容易发生NAHR导致的结构变化。
小结
综上,该研究组装得到高原鼢鼠染色体水平的高质量基因组,利用长读长测序数据评估了物种水平的变异,并且通过RNA-seq和报告基因检测证实了SV对低氧适应相关基因的影响。该研究还通过Hi-C分析高原鼢鼠和中华鼢鼠的染色质结构,发现三维基因组结构的进化也可能促进高海拔鼢鼠的低氧适应。
兰州大学生态学院李克欣教授、刘建全教授和内布拉斯加大学Jay Storz教授为论文共同通讯作者。兰州大学生态学院博士生安绚、硕士生毛乐言、博士生王寅嘉、青海省人民医院徐芹芹为该论文共同第一作者。兰州大学生态学院李博文青年研究员、海法大学Eviatar Nevo教授等参与了本课题,该研究主要得到国家自然基金(32271691,32271691)、十四五国家重点研发计划(2021YFD1200901)、引智计划(G2022175009L)、甘肃省基础研究创新群体(21JR7RA533)的资助以及兰州大学超算中心提供的计算资源。
参考文献
An, X., Mao, L., Wang, Y. et al. Genomic structural variation is associated with hypoxia adaptation in high-altitude zokors. Nat Ecol Evol (2024). https://doi.org/10.1038/s41559-023-02275-7