3D基因组结构已成为调控图谱变化研究的一大特征。在发育过程中,调控景观驱动着复杂的发育基因表达,但仍不清楚在进化过程中纳入新的基因和功能时如何保持其完整性。其在进化相关调节机制需要进一步解析。
近日,德国马克斯·普朗克分子遗传学研究所Michael I. Robson、Stefan Mundlos等研究人员合作在Cell杂志上发表研究“Repression and 3D-restructuring resolves regulatory conflicts in evolutionarily rearranged genomes”。研究人员报道了一个胎盘哺乳动物的特异性基因Zfp42是如何在一个古老的脊椎动物拓扑相关域(Ancestor TAD)中出现,而没有破坏其保守基因Fat1表达。在胚胎干细胞(ESC)中,TAD内分区将Zfp42和Fat1分开,驱动二者独立表达的增强子也一并被分开了。这种分离是由染色质活性调控的,而非CTCF/cohesin。在胚胎肢体中,无活性的Zfp42与Fat1在一个完整的TAD,并对活跃的Fat1增强子无反应。既不是Fat1增强子的兼容性差异、也不是核膜(NE)的附着使Zfp42失活,而是Zfp42的启动子通过背景依赖的DNA甲基化使得其对增强子失去作用。
图1 文章信息
研究思路
研究结果
1、进化过程中保守的古TAD,Zfp42R和Fat1共享调控环境但单独表达
Zfp42(Rex1)是一个备受研究的多能性转录因子。该研究构建小鼠E11.5胚胎肢体的cHi-C图谱,Zfp42位于一个CTCF分界的TAD内,与真兽类哺乳动物特异性基因Triml1和Triml2一起位于TAD中央293 kb区域(Zfp42R)。该TAD包含有Zfp42和Fat1等8个基因,TAD中Fat1和Mtnr1a在所有脊椎动物中相对保守,并且位置靠近TAD边界。
研究继续取鸡和负鼠的胚胎肢体构建Hi-C图谱,结合多个不同脊椎动物的Hi-C数据再处理,确认胎盘哺乳动物的TAD在脊椎动物中是保守的,相对于二倍体基因组,保持了基本恒定的长度。并且Fat1及其保守的单基因TAD在祖先脊椎动物中共同进化,Zfp42R是在真兽类胎盘哺乳动物整合入该TAD。
图2 保守的TAD结构
在小鼠、负鼠和鸡的胚胎肢体中,Fat1整胚原位杂交(WISH)和ATAC-seq表明,Fat1的表达在约3亿年内是保守的,且一直由保守的增强子调控。Fat1-enh是一个调控Fat1的保守远端元件,但删除其对Fat1在肢体的RNA-seq表达没有影响,表明存在多个增强子参与表达。因此,Fat1与结构稳定的TAD和功能保守的增强子共同进化,促进其胚胎肢体的表达,Zfp42R基因在真兽类哺乳动物的TAD中出现,且没有破坏Fat1的保守表达。
图3 Fat1与结构稳定的TAD和功能保守的增强子共同进化
该研究进一步构建小鼠胚胎发育的CAGE(cap analysis of gene expression)和scRNA-seq图谱,Zfp42R和Fat1在ESC、胎盘滋养层(TSC),以及胚胎外胚层和内胚层中共同转录,但Zfp42R在原肠胚形成后不活跃。WISH进一步予此进行了证实。因此,Fat1和Zfp42R共享调控环境,但基本上是独立表达的。
2、ESC中,Fat1和Zfp42在TAD中利用各自增强子进行活动
在E11.5肢体中,ChIP-seq H3K27ac标记的潜在增强子信号聚集在TAD的边界附近和Fat1的基因体内。在ESC中,活性增强子信号有两簇聚集在Zfp42R和Fat1基因体区,并且Zfp42R和Fat1与边沿的基因沙漠1和2(D1&D2)没有互作。据此,包括小鼠的8细胞胚胎和人的ESC,在Fat1和Zfp42都活跃的多能真兽动物细胞中,古TAD可划分为四个结构域(D1、Zfp42R、D2和Fat1),且Fat1和Zfp42R仅和各自的局部增强子互作。
研究人员构建了一系列E11.5胚胎和ESC突变体(ΔZfp42R、ΔD1、ΔD2、ΔD1+2)。E11.5 肢芽RNA-seq显示,Fat1的表达因D1和D2缺失而受严重破坏,和增强子Fat1-enh的缺失一致,但不受新出现的Zfp42R影响。相比之下,Zfp42R基因在野生型和所有突变体肢体中仍然没有活性。因此,在发育后期,Fat1的表达是由其古TAD和远端增强子调控的,但这些对Zfp42R的表达没有影响。在ESC中,Fat1和Zfp42R表达在突变体中普遍不受影响,说明Fat1和Zfp42R只利用其在古TAD中各自隔离的区域内部增强子进行活动。这意味着在多能性过程中,Fat1和Zfp42R基因在功能上是相互独立的。
图4 多能性过程中,Fat1和Zfp42在TAD中利用各自增强子活动
3、ESCs中Zfp42/Fat1 TAD分区和区室化(Compartmentalization)有关
CTCF和cohesin亚基Rad21的结合位点在ESC的Zfp42R内特别富集。然而,在ESC删除CTCF((dCTCF))或Rad21(dRad21)后,Zfp42/Fat1位点继续分割成四个结构域。因此,Zfp42/Fat1TAD分区在ESC中的发生不依赖CTCF和loop挤压。
图5 TAD分区在ESC中的发生独立于CTCF和loop挤压
通过Hi-C和DamID-seq( Lamin B1)构建E11.5肢体和ESC compartment特征图谱,另外应用3D-SIM通过Lamin B1免疫标记对NE进行可视化,对染色质结构特征综合分析。据此发现,活性和非活性染色质在肢体的完整TAD中成功结合,但在ESC中分割成不同的区间。
在肢体中,无活性的Zfp42R与D1和D2结合成一个附着NE的大B compartment,横跨大部分的TAD。相比之下,Fat1位于一个活跃的A compartment内,与Fat1-enh一起,并保持与NE的局部分离。因此,完整的肢体TAD同时支持多个非活性和活性compartment。在ESC中,活跃的Fat1和Zfp42R与它们的近端增强子重新组织成分开的A compartment,拥有较低的NE接近度,与D1+D2的交融程度较低。D1和D2本身仍然是与NE相连的B compartment,但很难相互融合在一起。ESC中的Zfp42R、D1、D2、Fat1以分离结构存在,并且loop挤压消除可进一步加强这种分区。综合来看,在ESCs中,由染色质状态定义的拮抗性compartment凌驾于环挤压之上,分解TAD。
图6 Zfp42/Fat1 TAD在肢体中适应不同的染色质环境,但在ESC中发生重组
4、肢体中,DNA甲基化使得Zfp42对Fat1调控信息不敏感
发育后期的胚胎肢体中,尽管在共享的完整TAD中接触Fat1及其远端肢体增强子,Zfp42R基因仍然不活跃。LAD(Lamina-associated domains)是紧凑的异染色质结构域,可以抑制转录。通过在TAD内的7个位置和TAD外的1个位置整合最小的β-球蛋白(Glob)启动子-LacZ传感器结构,绘制Fat1调节活动,研究人员发现,LAD既不直接沉默Zfp42R基因,也不间接阻止其与Fat1增强子的联系。
将Zfp42、Triml1/2或Fat1核心启动子交换到LacZ调控传感器中,并将这些定位在Zfp42Rb,重现了Fat1样的肢体、面部和耳朵LacZ活动模式。结合胚胎肢体的qPCR,表明调控存在某种程度的选择性。然而,这些增强子-启动子兼容性的差异不能解释后期胚胎中Zfp42R基因的完全无活性。
对已发表的ChIP-seq进行分析,在E11.5肢体的Zfp42R启动子处没有H3K27me3或H3K9me3信号富集,从而排除了多梳蛋白和经典异染色质化作为沉默机制的可能性。然而,WGBS发现肢体芽和ESC之间围绕Zfp42和Triml1/2启动子的差异甲基化区域。基于分析结果,研究推断,高度环境特异性的DNA甲基化使Zfp42R基因对后期胚胎组织中的Fat1增强子活性永久不敏感。
随后,研究人员生成了缺乏DNA甲基转移酶3B(Dnmt3b)的E11.5胚胎,结合Dnmt3b−/−胚胎肢体的WGBS、ΔD1+D2胚胎的RNA-seq等分析,发现内源性Zfp42启动子对Fat1肢体增强子不敏感,确认它至少是由DNMT3B驱动的DNA甲基化而沉默的。
图7 DNA甲基化使得Zfp42对Fat1调控信息不敏感
5、基因冲突表达常见于多基因TAD
从上可知,至少有两种机制可以适应单一的调控环境,以在进化中承载多个表达程序。最后,研究人员利用Hi-C和FANTOM5表达数据,量化了这种表达在全基因组调控环境下的普遍性。在几种小鼠细胞的2400个左右TADs中,有约12%仅包含一个在发育GO-terms中富集的基因,88%左右的TAD包含多个基因,研究人员将其分为普遍(Ubiq.)或非普遍(non-Ubiq.)两类。像Zfp42/Fat1结构域这样的多基因TAD在基因组中占主导地位,经常包含多个non-Ubiq.“发育的”和Ubiq.“管家”基因。随后,基于共表达分析,发现“发育的”non-Ubiq.基因位于同一TAD中时,会更频繁地共同表达,“管家”Ubiq.基因则不然。因此,像Zfp42/Fat1一样,在共享的TAD调控中,冲突的发育基因表达是进化过程中基因组的一个普遍特征。并且丢失的DNA甲基化优先激活的启动子是发育性的和接近同一TAD中其他发育性位点的增强子的。
这一起表明,在进化过程中,随着基因的出现或被重新排列到共享结构域中,调节冲突经常出现。然而,这种冲突可以通过DNA甲基化驱动的沉默、三维重组,以及可能的其他合作机制来调节。
图8 基因组中冲突调节是普遍的
小 结
该研究通过研究Zfp42/Fat1基因座,发现在胎盘哺乳动物中Fat1的古老TAD内出现了一个包含Zfp42基因的300kb区域。有两种机制使Zfp42独立调控同时保持Fat1保守表达。在ESC中,古TAD被分割成Zfp42和Fat1,且在较小的区域内有不同的增强子,从而调控它们各自的活性。在胚胎肢体中,Zfp42对它在完整的古TAD内接触到的Fat1增强子通过高度依赖的DNA甲基化而变得惰性。在进化过程中,至少通过重组三维染色质和选择性启动子沉默,可以将多种新的表达程序纳入一个单基因座。通过这种方式,该研究展示了基因组如何解决发育和进化过程中不可避免的调控冲突的原则。
图9 机制模型
参考文献:
Ringel A R, Szabo Q, Chiariello A M, et al. Repression and 3D-restructuring resolves regulatory conflicts in evolutionarily rearranged genomes[J]. Cell, 2022, 185(20): 3689-3704. e21.