在全基因组关联研究中报告的近90%的疾病易感基因座位于非编码区,并被预测起到调节作用。然而,识别性状和细胞类型之间的遗传中介关联对于了解遗传变异的功能影响和潜在的疾病机制至关重要。单细胞RNA测序技术可以在单个细胞的分辨率下定量检测基因的表达。这样的信息可以整合到GWAS分析中,以发现人类复杂特征的细胞类型特异性。通过性状和细胞类型关联的综合图谱,可进一步探索代谢性疾病和免疫相关疾病中促成关联对的驱动过程。
今年10月Genome Biology在线发表了题为“scGWAS: landscape of trait‑cell type associations by integrating single‑cell transcriptomics‑wide and genome‑wide association studies”的研究论文。该研究论文是使用来自9个人/鼠组织(总计108万个细胞)的18个scRNA-seq数据集,在40个全基因组关联研究(GWAS)数据集中展示了scGWAS,并确定了2533个性状和细胞类型关联,每个关联都有重要的模块供进一步研究。
图1 文章发表信息
主要研究结果
1、性状-组织-细胞类型的关系
收集了40个具有代表性的复杂特征的GWAS数据集,含精神疾病、神经退行性疾病、免疫疾病、新陈代谢特征等。如图2所示,确定了在不同大脑区域丰富的神经和认知特征,脾和全血丰富的免疫相关特征,以及肝脏丰富的脂肪代谢特征等许多性状-组织之间关联,并且这一结果与大多数生物学结果一致。而一些特征焦虑(ANX)、内在化问题(IP)、强迫症(OCD)和胰腺癌(PANCAN)]显示与任何组织无关。四种组织(全血、肺、脾和小肠末端回肠)与几种常见的免疫调节疾病有关。
图2 用于解码与特征相关的组织和细胞类型的分析框架
2、scGWA概括了生物学性状-细胞类型关联
使用18个单细胞数据集将scGWAS应用于40个GWAS的数据集,对于每一对性状和细胞类型,研究者通过比例测试了一致性模块的比例是否显著高于随机预期。结果在40×437次的运行中共确定了2533个特征-细胞类型关联。在18个单细胞数据集中,四个大脑小组揭示了最多的关联,这可能是因为大脑有大量的细胞类型,且大脑疾病占很大比例。在40个测试的GWAS概要数据集中,与脑细胞类型有显著关联的特征几乎是与大脑相关的特征和疾病,它们形成了两个子簇(图3),该结果证实了BMI与几种神经细胞类型的关联。来自不同小组的免疫细胞发现与免疫相关的特征。除了这些预期的关联外,还发现新的关联可揭示潜在的共病机制。如发现CAD和CAD_RHR在肺中有多种细胞类型,即肺损伤与冠状动脉疾病有关,RHR与来自胰腺的β细胞有关。
图3 scGWAS结果图解
3、scGWAS检测更多临床相关基因
研究者进行了一系列的富集化分析,以评估scGWAS鉴定的基因。对于每个性状-细胞类型关联,定义了两个基因集作为对照:一个包含相应细胞类型表达数据中表达最高的基因,并且具有与模块基因相同的基因数量;另一个包含在相应的GWAS数据中被列为最显著的、大小相同的基因。如图4A所示,scGWAS鉴定的基因在功能上往往比仅使用GWAS鉴定的基因更丰富。与简单地使用最小p值选择的原始GWAS启动的基因相比,scGWAS被证明可以检测到更多的功能基因。
图4 对scGWAS结果的独立验证
4、scGWAS检测到可复制的性状-细胞关联
多变特征和panels能够对结果进行cross-panel 评估。研究者选择了多个报道过的几种细胞类型,用于特征细胞关联的交叉复制,这些细胞类型主要来自大脑、胰腺和免疫系统。如图4B所示,5/5和4/5在所有五个panel中重复出现,在肺、脾、肝和蜕膜中发现了这些细胞的不同亚型。先前报道的免疫成分的四个特征在免疫相关细胞类型反复出现。总之,这些跨panel相比较的表明,scGWAS发现的关联是可靠且可复制的。在这项研究中,除了用于GWAS 和scRNA-seq之间标准化处理外,没有进行任何预处理来控制批次效应。然而,scGWAS 的结果在检测相关细胞类型方面是一致的,这意味着scGWAS能克服批次效应并在检测准确特征相关细胞类型的稳定性更高。
5、基于细胞类型的性状相似性
考虑到多个性状或疾病可能与相同的细胞类型相关,接下来检测了性状之间的共同基因。如图5A所示,确定了三个主要特征组:免疫(哮喘、T1D、T1D_C、MS和RA),脂质(TG,HDLE,LIP_HDLE,TC)和大脑疾病(GNEU、DS、NeU、ALS等)。通过检查显示高度重叠的基因对,发现同一组中的性状通常比来自不相关组的性状具有更多的共同基因。通过检查显示高重叠基因的性状对(图 5B),发现同一组中的性状通常比不相关组中的性状具有更多的共享基因。这些结果表明,共享遗传成分的性状往往在同一细胞类型中具有更多的基因。
图5 基因的性状间相关性研究
6、胰腺、肝脏和免疫系统中的性状和细胞类型关联
胰腺是维持人体代谢平衡的器官,它与多种疾病有关,尤其是糖尿病。scGWAS 揭示T2D 与所有五个 scRNA-seq panel中的 β 细胞以及 α 和 δ 细胞细胞相关。发现T1D和T1D_C都富含多种细胞,包括 β 细胞和delta细胞。肝脏是人体代谢的主要组织,包括乙醇代谢。众所周知,AUD与脂质相关的特征都与肝脏有关。使用scGWAS,发现三组特征在肝细胞中丰富存在,这些结果证明,在同一细胞类型中,不同的基因和过程涉及不同的性状。免疫细胞及其各种亚型存在于所有panel中,其中包括主要的B细胞、T细胞、巨噬细胞、单核细胞和树突状细胞(DC)。在结果中,具有较强免疫成分的特征/疾病,如哮喘、MS、RA、T1D和T1D_C,无论组织来源如何都富含免疫细胞。通过检测共享基因,发现了一些HLA基因介导性状和免疫细胞之间的关联(如肿瘤坏死因子),这一结果揭示了潜在疾病的病因。
图6 使用胰腺、肝脏及肺panels的性状-细胞类型关联
研究结论
“
scGWAS确定的性状-细胞类型关联虽然局限限于性状-组织关联,但能揭示新的关系,为尚未解决的性状-组织关联提供了新的工具。此外,在每种特定的细胞类型中,与不同特征的关联通常由不同的风险基因集介导,这意味着驱动过程的疾病特异性激活。scGWAS是利用单细胞表达数据在细胞类型水平上探索复杂疾病,为潜在疾病机制提供了新的见解,更为研究各种疾病提供了计算框架。