家猪(Sus scrofa)不仅是优质的肉食来源,还是重要的生物医学模型和器官移植供体资源,拥有宽泛的医学研究潜能和商业经济价值,近年来,家猪的医学价值已被不断证实。同时, 西方的两种商用猪(LW和Duroc)和中国的两种本地猪(MS和ES)在生长、肉质和饲料转化率等有所不同,西方猪种经济价值更高,在这背后,除了已知的基因表达谱,家猪基因组的调控元件是否存在差异也引起了关注。
2021年4月13日,华中农业大学的赵书红教授和李新云教授为通讯作者的论文“A compendium and comparative epigenomics analysis of cis-regulatory elements in the pig genome”发表于知名期刊Nature Communication,该研究系统绘制了4种家猪的表观基因组、转录组、TF结合和3D染色质环图谱,补充了相关顺式调控元件的信息,大大改善了我们对猪基因组中功能元件的理解。
图1 文章信息
研究材料:两种西方雄仔猪(LW和Duroc)和两种国内雄仔猪(MS和ES),这4种家猪的12种组织(骨骼肌、脾、心、肾、肝、脂肪、肺、胰腺、胸腺、大脑、小脑和十二指肠)。
测序技术:RNA-seq、ATAC-seq、Hi-C和ChIP-seq。
#1
家猪调控元件和转录表达的组织特异性
该研究采用RNA-eq,ATAC-seq、ChIP-seq(H3K4me3和H3K27ac)和Hi-C得到高质量的家猪转录组和表观基因组数据集。
研究人员对ATAC数据质控后找到220723个非冗余的顺式调控序列,包含有37838个可能的启动子和146399 个可能的增强子,连起来的长度为434.92MB,占susScr11基因组的17.38%,比对得到的增强子和启动子分别有86%和50%以上是新识别的。
图2 猪基因组的顺式调控元件以及猪骨骼肌的3D染色质结构图
4种家猪中11种组织的转录特征分析显示,高表达基因都是管家基因,Z score方法识别得到4510个组织特异性基因,并且相较于Tau的注释基因,3316个新识别的转录本具有更好的组织特异性。增强子调控基因的表达,研究人员汇总H3K27ac信号得到具有组织特异性的增强子图谱,并且HOMER分析显示这些序列富集有其他物种中组织特异性转录因子的motifs,GREAT的GO富集也找到一致的组织特异性功能,说明了顺式调控元件序列的组织特异性。同时,ROSE算法找到的超级增强子区域,以及ChIP(H3K4me3和H3K27ac)启动子区域都有着组织特异性。
图3 转录图谱和顺式调控元件分析
#2
家猪基因组的三维基因组结构
研究人员使用HOMER的runHiCpca.pl脚本得到家猪三维基因组中活跃的A compartment和不活跃的B compartment。在40 kb分辨率下识别TAD,得到2364个边界以及2305个TAD。Spearman相关系数(SCC)分析结果显示,一个TAD中有着重要的基因-基因、增强子-增强子和增强子-基因对联系。随后,应用校正过的HiCCUPS算法找到25 kb分辨率下的15485个染色质环以及40 kb分辨率下的11838个染色质环。整合分析Hi-C数据和顺式调控元件数据,两个分辨率下的染色质环都与顺式调控元件强相关,联合ATAC-seq分析CTCF-binding motifs,进一步证实CTCF结合位置在哺乳动物基因组中高度保守。同时,应用GWAS分析SNP附近富集的增强子,结果显示SNP附近的增强子和猪生长特质有关。
图4 猪基因组的顺式调控元件的调控
#3
不同猪种之间的基因变异和顺式调控差异
西方的两种商用猪和中国的两种本地猪的差异主要体现在背脂厚度和生长速率。在这种差异下,不同猪种之间顺式调控差异和基因变异有待探究。
在四种猪种的骨骼肌,脂肪,脾脏,肝脏和心脏的基因表达上,不同国家品种猪差异基因显著多于同一国家的不同品种猪,同一国家品种猪的差异基因和H3K27ac信号相关性更好,进一步比较不同品种中和TAD差异基因、顺式调控元件相关的H3K27ac信号强度,发现四个品种之间的基因表达差异与H3K27ac(增强子或活性启动子)信号的差异富集有关。同时,比较西方商品猪与中国本地猪,等位基因频率不同的251361个SNP定位在活性启动子或增强子中,ATAC-seq足迹分析显示具有不同等位基因频率的SNP可能与差异表达基因的顺式调控元件的活性有关,因此进一步计算遗传分化系数以分析基因变异对组蛋白修饰和基因表达的影响,并且结合先前的同一TAD中增强子对和增强子-基因对的关系,结果表明基因序列的变化和组蛋白修饰的变化都可能与不同品种之间基因表达的差异有关,但是组蛋白修饰的变化可能与基因的差异表达更密切相关。
图5 猪品种中顺式调控元件的组蛋白信号变化
#4
哺乳动物基因组之间顺式调控元件的保守性和调控演变
保守序列水平是评价功能元件保守性的一个重要凭据。该研究通过现有的猪的数据,结合Roadmap Epigenomic数据库中人的数据和ENCODE中鼠的数据,利用LiftOver比较发现人和猪基因组之间保守的顺式调控元件比例较高,保守顺式调控元件可以在猪和人的细胞中活化。同时,比较Roadmap Epigenomics的染色质态注释发现,猪特异性增强子和启动子在人的HEK-293T cells和鼠的C2C12 cells也有活性,非保守元件也能发生物种特异性事件,这在物种特征中可能有重要作用。对比非同源基因,同源基因和基因表达相关性较好,研究人员观察到在猪和人类基因组中,保守的增强子以及具有谱系特异性序列但组蛋白(H3K27ac)修饰模式相同的增强子,都导致了人和猪相应组织中一样的基因表达模式。
图6 猪和人类基因组之间的TAD重排与头部和面部的形态演变有关
此外,研究还比较了猪骨骼肌组织和人胚胎干细胞的三维结构,在猪(79.15%)与人(67.28%)之间有1871个TAD保守边界,伴随着近期三维结构改变可以反映调控演变的呼声,研究人员比较人和猪的TAD结构,TAD重排有助于猪和人之间基因表达调控的变化。结合Human Phenotype Ontology (HPO) 数据库的人类表型数据,研究发现重排TAD中的基因主要富集于人的头部和面部表型。猪和人类基因组之间的TAD重排与头部和面部的形态演变有关。HPO数据库中头部和面部相关的19个基因包含在8个重排TAD中,比较20个物种中这8个TAD的染色体位置,结果表明猪和人染色体间TAD重排可能促进了鼻子,嘴巴和其他颅面表型的演变。
总 结
这项研究对猪基因组的转录活性、染色质开放性、染色质景观和3D结构进行了分析,得到了高质量的转录组和表观基因组数据,强调了构建链特异性文库的优越性,并且在不同的猪品种以及三种哺乳动物之间进行了表观遗传学比较,不仅为猪的表观遗传学提供丰富的新数据资源,还提供了与将猪作为人类生物医学研究模型相关的基本比较表观遗传学数据。该研究将有助于改善牲畜(猪)育种以及人类疾病和生物学研究。
参考文献:
Zhao Y, Hou Y, Xu Y, et al. A compendium and comparative epigenomics analysis of cis-regulatory elements in the pig genome[J]. Nature Communications, 2021, 12(1): 1-17.
图源网络/侵删