大家可还曾记得去年的一篇小鼠嗅觉神经元Nature文章?使用Hi-C研究三维结构的(Nature:有限的嗅觉基因识别近乎无限的气味之谜 三维基因组调控机制大放异彩!),文中发现了大量的反式互作,涉及多个增强子聚集成簇特异性与嗅觉受体基因互作,从而调控其选择性表达,这一结果着实惊艳,让人们注意到特定反式互作的重要性。近期,又有一篇关注反式互作的文章发表了,而这一次,它,调控了可变剪切!
文章采用Hi-C+ATAC-seq+RNA-seq多组学技术,对人类多能干细胞定向分化为心肌细胞的过程进行了结构与功能研究,分析内容层层递进,验证结果证据充足,详情请阅览下文。
文章标题:Dynamics of genome reorganization during human cardiogenesis reveal an RBM20-dependent splicing factory
发表期刊:Nature Communication
发表时间:2019年4月4日
1.Hi-C结构变化基本结果描述
Chromatin structure dynamics during human cardiogenesis.
从未分化的人类胚胎干细胞hESC依次获得不同分化时期的心脏中胚层(mesoderm , MES)、心脏前体细胞(cardiac progenitor, CP)和成熟的心肌细胞(cardiomyocytes, CM)。每个时期细胞的Hi-C分别进行了2个生物学重复,此外还对2个胎儿的心脏样品进行了Hi-C。
在500kb分辨率下计算compartment,发现不同时期的细胞,基因组整体上分为了一半为A compartment,一半为B compartment,在分化过程中,compartment整体较为稳定,只有19%的基因组发生 compartment转换,大部分变化为单向转换(B-A or A-B),少量变化为回复转换(A-B-A or B-A-B)。
发生在同种分隔区(A-A or B-B)中的顺式互作更强,分化过程中A中的最强顺式互作转为了B中的互作,这种转换使B-B中的远距离互作(>10Mb)增加,而A-A和B-B中的反式互作则相对独立于分化时期。这些结果表明,相对于常染色质,在分化过程中异染色质逐渐变得更加压缩。
1.Hi-C结构变化与基因表达相关联
A/B compartmentalization changes reflect expression dynamics.
RNA-seq鉴定出差异表达基因具有细胞类型特异性,在CPs和CMs细胞中表达上调的基因富集在B to A转换的区域中,CMs中表达上调基因的GO功能富集在发育和心脏功能相关的代谢途径中,表明很多心脏发育基因由位于B compartment转换到位于A compartment中,从而被激活。
此外,即使只有4%的区域发生了回复转换(A-B-A or B-A-B),在CPs中这些区域内的基因在转换为A compartment的短暂时期内,其表达水平也表现出了显著的增高,如基因BMPER和CXCR4,而中胚层调节因子EOMES则伴随着转为B compartment而出现表达水平下调。
TAD dynamicity is independent from A/B compartmentalization.
接下来采用两种方法(Directionality index和Insulation score)来评估分化过程中TAD的变化,发现大多数TAD边界在分化不同时间点比较稳定,compartment A中TAD的平均大小显著小于B compartment。
从hESCs 分化到CMs时期,TAD边界消失的区域富集在组成型B区或由A转换为B的区域,结合之前观察到的异染质色逐渐变得更加压缩的现象,这些结果表明一些TAD在分化过程中可能与邻近区域一起被融合压缩了。然而,边界消失与基因表达并没有直接的相关性。TAD边界增加的区域与最为邻近的基因表达激活相关,但并不与compartment B转换为A相关。总体上,分化过程中新形成的TAD边界及相关基因的表达在很大程度上不依赖于compartment的改变。
3.ATAC染色质可接近性与Hi-C结构相关
Chromatin accessibility and 3D organization are correlated.
在分化过程中,A compartment中的染色质开放性peaks增加,B compartment中的染色质开放性peaks减少。CM-specific ATAC-seq peaks在A to B转换的区域缺乏,在B to A转换的区域富集,这些富集区域peaks的motifs对应了心脏发生过程的GATA、NKX家族的重要转录因子。
分析一些公共已发表的转录因子ChIP-seq数据,结果发现一些特定转录因子的ChIP信号富集在时期特异性的ATAC-seq peaks中。具体的,转录因子GATA4、NKX2-5、TBX5在CM时期的结合位点均特异性富集在CM时期的ATAC-seq peaks中,而GATA4在hESCs时期的结合位点并未特异性富集在hESCs时期ATAC-seq peaks中,而是富集在constitutive peaks中,这提示GATA4在此细胞中可能发挥着“housekeeping”的功能。
此外,GATA4的peaks在CP-CM和CM时期的富集程度类似,而NKX2-5和TBX5在CM特异的peaks中更加富集,表明GATA4可能是分化过程中更早期的驱动因子(或许作为先锋转录因子),而后NKX2-5和TBX5发挥加强GATA4依赖的转录网络调控功能。
4.结构变化与关注的靶基因相关联
Dynamic regulation of TTN by 3D structural changes in cis.
在由B to A转换的区域中富集了一些大型的心脏相关基因,其中包括人类最大的蛋白编码基因-肌联蛋白titin基因(TTN),其突变是引起家族性扩张型心肌病(DCM, familial dilated cardiomyopathy)的原因。作者观察到TTN位点由B转为了A区,其两个TSS位点的染色质可接近性均变得开放,一个是TNN全长转录本的TSS位点,另一个是较短的异构体转录本的TSS位点(Cronos TTN),且基因表达水平均上调。这两个转录本在发育过程中均发挥着重要作用,短转录本TSS位点下游的突变比长转录本的突变对细胞的毒性作用更大。
这些TSS位点处的ATAC peaks motif对应了心脏相关转录因子GATA4、NKX2-5和TBX5。此外,TTN的ATAC peaks与CTCF的结合位点存在overlap,且位于TTN转录终止位点(TTS)的CTCF motif方向与基因内的motif方向相反,预示TTN位点可能形成了基因内loop结构。
在分化过程中,与TTN的ATAC peaks overlap的CTCF结合位点占位减少,且TTN的TSS位点与基因内部的互作明显减少,而与TSS位点上游区域的互作变化很少。这些结果表明,在hESCs时期的B compartment中,TTN可能通过CTCF介导形成基因内loop结构使自身处于表达沉默状态,在随后的分化过程中,TTN基因区的CTCF占位减少,TSS开放性增加,从而调控其表达水平上调。
TTN interacts in trans with multiple RBM20-regulated loci.
在分析了TTN位点的顺式互作特征之后,作者接下来分析了其反式互作作用。在B to A的区域,有两个与TNN存在反式互作的心脏基因CACNA1C(编码L型钙离子通道中心亚基)和CAMK2D(编码调节兴奋-收缩偶联的钙调蛋白依赖激酶),作者注意到这些基因均存在广泛的可变剪切,而且它们是一个已知的剪切调节因子RBM20的靶基因。RBM20通过与外显子直接结合,促进所选外显子的互排作用来调控一些心脏基因的组织特异性异构体表达,其突变是引起DCM心肌病的一个相对普遍的原因。
之前有研究报道,在肌肉细胞的细胞核间期,RBM20蛋白与新生成的TNN mRNA存在明显的共定位,作者推测TNN与CACNA1C和CAMK2D之间的互作是RBM20介导的广泛反式互作的结果。为了验证这一推测,作者重点关注了CM中表达上调的存在可变剪切的16个基因,它们在人类和小鼠心脏中均受到RBM20的调控,结果发现这些基因均特异性的在CM中表现出了Hi-C反式互作的相关性。
使用FISH针对与TNN存在反式互作的6个基因位点包括CACNA1C基因进行了距离验证,发现与hESC相比,TNN与这些位点在CM细胞中的距离明显更近。
这些相同的FISH结果表明,TTN和其它的测试位点距离核边缘的位置与它们所处的compartment状态是相关的。在分化过程中,TTN从核边缘移动到核内部,代表着由B区转变为A区的异染色质转变为常染色质,而多种RBM20的靶基因与TTN的互作增强,移动到细胞核中央,从而上调自身的表达。
5.功能验证RBM20介导剪切工厂结构形成的作用模型
TTN trans contacts need transcription-dependent RBM20 foci.
为了功能验证RBM20介导形成剪切工厂结构,作者在CM细胞中使用转录抑制剂放线菌素D(ActD)处理细胞后,发现RBM20转录本的信号快速丢失,且TTN与CACNA1C和CAMK2D位点间的空间邻近性显著减弱,这说明了TTN反式互作依赖于RBM20的转录发生。
The TTN pre-mRNA nucleates an RBM20 splicing factory.
为了进一步研究剪切工厂的形成机制,作者使用CRISPR/Cas9分别敲除了TTN的启动子(TTNΔProm)和在TTN的第一个编码外显子中插入了无义突变(TTN KO,不影响转录和剪切,仅影响mRNA翻译),结果发现在TTN ΔProm中,RBM20的表达水平正常,但蛋白定位异常,聚集程度显著减弱,而其定位在TTN KO中则表现正常,这说明TTN mRNA对于招募RBM20聚集成簇是必须的,可能是因为TTN mRNA具有最多的RBM20结合位点。
最后,作者对RBM20进行了基因敲除,以验证RBM20对剪切工厂形成的作用。结果发现,在RBM20KO CM细胞中,TTN的转录异构体表现异常,正常情况下存在未成熟的N2BA异构体和成熟的N2B异构体,而在RBM20 KO细胞中,检测到大量的非生理的巨大异构体N2BA-G,检测不到成熟的N2B异构体。此外,CACNA1C和CAMK2D的可变剪切也受到影响,产生了异常的转录本。
RBM20的缺失减弱了TTN与CACNA1C和CAMK2D位点的互作(距离变大),改变了这些基因的可变剪切异构体,这些结果共同表明:RBM20蛋白通过介导TTN与CACNA1C和CAMK2D位点的反式互作,形成一种剪切工厂,从而高效调控这些基因的可变剪切过程。
这篇文章在对人类多能干细胞分化为心肌细胞的过程中,整合Hi-C、ATAC-seq和RNA-seq多组学分析,详细描述了染色质全局和局部的结构动态变化,以及对细胞命运转化过程中基因表达的调控机制,提供了可用于研究人类心肌细胞的发育和疾病模型。文章从整体到细节,从面到点,层层递进,并对关注的基因及反式互作特征进行了结构和功能验证,证据充足,是一篇值得学习和借鉴的好文章哦~
菲沙基因提供全套三维基因组多组学服务:(Capture) Hi-C + ATAC-seq + RNA-seq + ChIP-seq + 3C/4C + FISH,科学问题一站式整体解决方案,期待与各位老师的合作~
配图来源于网络/侵删
参考文献:
Bertero A, et al. Dynamics of genome reorganization during human cardiogenesis reveal an RBM20-dependent splicing factory. Nature Communication, 2019.