相信大家对金刚狼和死侍这两位漫威超级英雄并不陌生,他们都具有超强的自愈能力(当然,死侍的自愈能力明显更强,因为死侍的头被砍掉后也还能再生出来,但是金刚狼办不到)。虽然这是电影中的人物,但在现实世界中也存在类似的具有组织再生能力的生物。比如真涡虫、蝾螈、壁虎等,它们在断头断肢断尾后依然能重新长出来,只是时间长短不同而已(我们人类很是羡慕这种超能力哇)。
那么,为什么这些动物会具有组织再生的能力呢?为什么我们人类没有这种能力呢?
实际上,任何一个组织消失后都能够再生的这种“超能力”在很多动物中都存在,人们通过相关的一些转录组和功能研究已经鉴定出了较多的损伤应答关键靶基因,但是并不清楚这些基因是如何被联系起来的。已有研究发现斑马鱼的心脏和鳍以及果蝇的成虫器在再生过程中都涉及到组织再生增强子元件被激活,但是全身再生过程的表观调控应答机制还不清楚。
近期,来自麻省理工学院的Gehrke研究组以具有超强组织再生能力的无肠目动物(acoel)三带豹蠕虫(Hofstenia miamia)为研究对象,发现了大量调控全身再生基因开启的开关,系统构建了调控组织再生过程的基因表达调控网络。这一重要研究成果以题为“Acoel genome reveals the regulatory landscape of whole-body regeneration”发表在3月15日的Science杂志上。
全身组织再生的过程伴随着一系列基因转录水平的变化,而转录水平受到染色质开放状态的调控,这种组织再生过程的转录调控机制还未被阐明。研究者以三带豹蠕虫为研究对象,首先构建了其参考基因组序列,然后采用ATAC-seq技术揭示了上千个与再生应答相关的染色质开放区,并鉴定出动态的转录因子motifs结合位点。在组织再生过程中,发现早期生长应答(early growth response, EGR)因子结合位点最具有可变开放性的特点。通过RNAi抑制EGR位点的染色质打开,结果发现Egr可以作为一种先锋因子(pioneer factor)直接调控早期损伤诱导基因的表达开启。通过这些研究可以构建出全身组织再生过程的基因表达调控网络,也促进了物种间的组织再生过程的比较基因组学研究。
主要结果
○ 三带豹蠕虫的基因组组装及注释
材料:
单只虫子、多只虫子的混合、再生过程不同时间点的胚胎虫体
测序平台及文库:
Illumina 300bp、500bp PE文库,3kb、7kb MP文库组装,Nanopore纠错,Chicago scaffolding。转录组文库。
组装注释结果:
组装基因组大小950Mb(11.85% gaps),contigN50为15.8kb,scaffold N50为1.04Mb,杂合度0.426%,重复序列56%,基因数量22,632个,84% complete BUSCO genes。
(PS:小编不评论这个组装效果,只是纳闷为什么不用三代组装呢)
○ 组织再生过程中染色质开放状态的变化
材料:
将虫体从中部截肢后,在0h、3h、6h、12h、24h、48h共6个时间点分别取靠近头部和靠近尾部的损伤面,每个样品各2个生物学重复。
技术方法:ATAC-seq+RNA-seq(就是菲沙基因的明星产品之一哦)
分析结果:
在尾部再生过程中,一共鉴定出约18000个差异的开放区域,大部分位于内含子和基因间区
6h时的peaks最多,随后新打开的peaks逐渐减少,到24h~48h时逐渐关闭。
接下来重点寻找再生过程中的关键motif及转录因子,通过扫描全基因组中差异开放区的motif,发现一些motif在靠近头部的样品中变化较大,另一些motif在靠近尾部的样品中变化较大,还有一些motif在靠近头部和尾部的样品中均变化较大,其中,一种叫做早期生长应答(early growth response, EGR)因子的结合位点具有最高的可变开放性特点。EGR motif在0h时处于关闭状态,在3h时处于开放状态,直到48h时仍处于开放状态,提示Egr蛋白在再生过程中非常重要,并且EGR在其它可再生动物中的同源基因也被报道发挥重要作用。
○ 功能验证Egr是调控再生过程的主要转录因子
三带豹蠕虫基因组中仅含有单拷贝的EGR基因,通过RNA原位杂交实验发现EGR基因在截肢后1h的损伤面中表达上调,且在不同细胞类型包括表皮、肌肉、神经、成体未分化细胞、干细胞中均表达上调,说明再生过程的活跃进行。此外,利用RNAi抑制EGR的表达,发现虫体不能够再生出胚芽,不能重新长出头部和尾部。
不同时间点的RNA-seq数据表明,有61个基因在至少1个时间点的头部和尾部损伤面中均表达上调,选择了其中20个基因设计RNA探针进行原位杂交验证,证实13个基因确实是表达上调的。
那接下来的问题是,EGR基因与这13个基因之间的表达调控关系是怎样的呢?
研究者推测Egr是处于最上游的调控因子,为了验证推测,在6h时用RNAi抑制EGR表达后,发现这13个基因中有12个基因均出现显著的表达下调,并使用RNA原位杂交验证了其中4个基因的表达下调,表明Egr确实是位于调控再生过程上游的主要转录因子。
○ Egr直接调控其它损伤应答转录因子的表达
现在我们观察到在6h时用RNAi抑制EGR表达后,有12个关键基因的表达发生下调,那么它们为什么会下调表达呢?是否受到Egr的直接调控?
为了研究这种调控关系,研究者再次采用ATAC-seq技术,在6h时用RNAi抑制EGR表达后进行ATAC-seq,发现含有Egr蛋白结合位点的12个基因中,有10个基因的上游开放区均变得明显减弱,包括EGR本身的开放状态也趋向于被关闭。这10个基因包括编码2个转录因子(runt, deaf1),一些信号通路中的因子(follistatin, nrg-1, nrg-2, nlk),有多种功能的细胞质蛋白(p-protein, ankrd, mtss-1)和1个未知的蛋白(wound induced expression-1, wie-1)。这些结果表明Egr蛋白可以直接结合至自身和其它损伤应答基因的调控区来开启基因的表达。
○ Egr作为先锋转录因子按层级调控再生基因表达
通过分析染色质开放状态变化大小并进行功能验证,研究者最终提出了再生基因的层级调控网络模型egr–runt–nrg-1,即Egr蛋白通过自身结合到其它转录因子基因结合区开启其表达,包括结合到RUNT基因的启动子区开启RUNT的表达,然后Runt蛋白再结合到NRG-1基因的启动子区开启NRG-1的表达。这么看来,Egr好比一个能开启再生功能的开关,一旦被打开,就可以激发其它再生过程。
Egr基因家族成员在多个物种的损伤再生过程中均发挥着重要作用,这些物种包括一些脊椎动物、真涡虫、海星等,作为调控再生过程的主要转录因子,其在真涡虫中的作用通过ATAC-seq也得到了证明,然而有些物种,比如我们人类,即使存在EGR基因,但并不能实现组织再生功能(非常有限),这必定与其再生调控网络的差异有关,即信号传递关系与三带豹蠕虫不一样。
再生相关基因是如何连接在一起的,答案其实来自于基因组的非编码区和染色质结构状态。不同物种中进化出的调控方式不一样,其它物种中的再生调控网络关系还有待进一步的阐明,对此,本文提供了很好的研究范例!
菲沙基因长期致力于解决三代和三维基因组研究领域的科学问题,通过创新的Hi-C及ATAC-seq技术已完成近百个物种的染色质空间互作及开放状态分析,为大量科研学者解决了关键的基因表达调控机制。在ATAC-seq方面,菲沙基因已完成的物种包括人类的多种细胞系和组织,以及牛、羊、猪、鹅、鱼、蚕、鼠、蝇、拟南芥、棉花、水稻..........等等,我们期待能解析更多物种的染色质状态及非编码区的调控秘密,非常欢迎大家与我们合作~
参考文献:
Gehrke AR., et al. Acoel genome reveals the regulatory landscape of whole-body regeneration. 2019, Science.