酿脓链球菌
酿脓链球菌(A型链球菌(GAS))是一种严格致病的人类病原体,每年在全球儿童和成人中引起超过7亿的感染。人类感染的严重程度从相对轻微的链球菌性咽喉炎到极端严重和威胁生命的感染,如败血症和坏死性筋膜炎/肌炎,通常被称为“肉食”疾病。该生物体还会引起皮肤和软组织感染,并导致感染后遗症,如风湿热和风湿性心脏病,这是也是全球发病率高的一个重要原因。
GAS已被用作研究毒株类型与疾病表型关系的模型生物,流行性疾病emm28株是美国和许多欧洲国家与侵袭性气体感染相关的五大emm类型之一。
对2101株emm28 S. pyogenes 菌株进行全基因组测序,从中筛选出492株遗传多样性代表菌株进行转录组分析,50株进行毒力评价。数据分析为酿脓链球菌的生物学特性机制提供了全新的认识。
实验设计与方法
取样样本:
6个国家共收集2101株emm28 GAS菌株
测序策略:
· 2101株菌株基因组测序Illumina NextSeq 平均测序深度202X ;
· 50株菌株采用Illumina NextSeq进行转录组测序;
· 24株菌株采用Oxford Nanopore MinlON进行全基因组测序(从50株转录组测序菌株中筛选出)
对北美和欧洲6个国家在1991年至2016年26年间从侵入性感染中分离的2101株emm28 GAS菌株进行了基因组测序,美国共分离菌株952株,其中951株是疾病预防控制中心活性菌核监测研究的一部分。来自德克萨斯州的菌株为基因组参考菌株MGAS6180 (MGAS, Musser GAS株号)。应美国疾病控制中心(Centers For Disease Control,简称cdc)的要求,已对美国的分离株进行编码(A-J)。(表1)
表1
emm28主要种群通过贝叶斯聚类分为两个主枝(枝1、枝2)和四个亚枝(指定SCIA、SCIB、SC2A、SC2B)(图1a、b)。进化枝2的28.0 kb HGT(horizontal genetransfer)块包括nga-ifs-slo操纵子编码,ifs编码SPN的内源性抑制剂。重组获得nga-ifs-slo操纵子的高表达变体,可以增强毒性。
SCIB菌株最多,占总分离株数的49.7%,其次是SC2A(26.8%)、SCIA(22.3%)和SC2B(0.53%)。SCIA、SCIB、SC2A亚枝菌株随年份、地理位置、MGE(mobile genetic element)含量的变化而变化(图1c)。
SCIA菌株发生明显的时间位移,美国SC2A菌株激增,约55%为SC2A菌株。SCIB菌株主要是从芬兰、挪威、法罗群岛和冰岛的患者中分离出来的,而SCIA是加拿大流行的亚支。
评估队列中MGE多样性,20个最丰富的MGE-50基因型占菌株总数的90%(图1c)。
图1
为确定不同的基因表达模式是否与emm28群体结构非随机相关,首先对三个具有代表性的亚类(即SCIA,SCIB和 SC2A)的50株菌株进行了转录组测序(RNA-seq)分析。这50个菌株来自不同国家和国家内区域,并具有不同的MGE含量。
尽管50个菌株在基因组背景上有所不同,但经过分析的菌株数量,加上样本中转录水平之间极高的相关关系系数,可以鉴定与种群结构相关的不同转录组的变化(图1)。
鉴定了两种具有IER(integrative-conjugative element)转录体的菌株(图2a,b)。对这两个离群菌株的基因组序列数据进行检测,发现covS调控基因中有两个独立的大缺失事件(图2a,b)。编码 CovR/Covs,RopB和Mga等转录调控因子的突变可以改变大量的比例。
对于所有已知的主要调控基因中有野生型等位基因的46个菌株(图2c,d),分配到不同亚类的菌株之间差异表达的基因数量最多。在指数中期,比较SC2A菌株与SCIA和SCIB菌株(分别为32(2%)和15(0.9%))的转录体时,发现差异表达基因的数量最多。
3个基因亚支的早期平稳转录组比较,也为类似的模式,但差异表达基因的数量要大得多(5-9倍)。与SCIA和SC1B菌株(分别为318株(19.9%)和83株(5.2%))相比,SC2A菌株差异表达基因最多。大量差异表达基因位于水平转移的28.0-kb区域(HGT区域)。
近年来,SCIB菌株引起的感染在美国、芬兰、冰岛和挪威等多个国家呈上升趋势,而SCIA菌株呈下降趋势,这增加了SCIB菌株进化到比SCIA菌株更适合的可能性。因此,研究检测了区分所有SCIA和SCIB菌株的核心染色体)的基因差异,发现所有SCIB菌株在GRAB的RivR-a负调控基因中均存在两个相邻的非同义突变。在中位相时,GRAB是SCIB菌株中与SCIA和SC2A菌株相比唯一上调的基因。与SCIA相比,SC1B和SC2A菌株早期稳定期GRAB转录本丰度较高。GRAB是一种细胞表面锚定的蛋白,与a2-巨球蛋白结合,使其在气体表面保留半胱氨酸蛋白酶SpeB的蛋白水解活性形式,防止气体被抗菌肽LL-37杀灭,并有助于小鼠模型的侵入性感染。
图2
传统上,细菌的转录组分析是基于对数期的菌株做三个生物学重复。但是,这种方法在研究数百种菌株时不经济适用。鉴于RNA序列的准确性、敏感性和可重复性有所提高,假设,使用单菌株(即缺乏生物学重复)进行大规模转录组分析,使用RNAtag-seq来增加应变通过率进行转录分析。无生物学重复菌株和有生物学重复菌株表达数据高度相关。
图3
为了检验442个单一菌株的转录组之间的关系,首先对归一化的表达数据使用主成分分析(PCA)并鉴定了两个主要的簇,称为簇A(n = 339)和簇B(n = 83)。 野生型菌株(经生物信息学评估,所有主要调控基因均具有野生型等位基因的菌株)除10株离群菌株外,主要与cluster A相关(图3a)。利用Pilon (Methods)对这些离群菌株的基因组数据进行复检,在这10个菌株中发现了8个covS全球转录调控保守基因中未检测到的indels。因此,转录组引导的多态性发现并确定了这些因素背后的遗传原因。
在分析283个单一菌株的转录组谱的基础上,使用随机森林分类来预测8个异常菌株的类别标记。基于转录组的分类正确地将所有八种生物鉴定为covS突变菌株)。在81个covRS和21个ropB菌株中,分别有85.2和61.9%的菌株被准确分类。covR菌株与野生型菌株相似被错误分类为野生型表型(转录谱),并与cluster A分组(图3c)。因此,转录谱的机器学习分类准确预测了主要调节基因突变株的基因型(调节基因突变状态)和转录表型(野生型突变样)。
将离群菌株重新分配为covs突变体,使cluster A同时具有野生型和突变体菌株,而cluster B仅由突变体菌株组成(图3b)。
对cluster A和cluster B转录组和基因组数据的检查产生了五个结果。首先,所有cluster B菌株都有covs或covR突变,其次,大多数covs(68.5%)或covR(37.5%)突变的菌株被分配到cluster B(图3c)。第三,分配到cluster A的大多数菌株是野生型的,或者在除CovRS以外的主要调控基因中有突变。第四,cluster B菌株的差异表达基因数量明显高于cluster A(图4)。第五,两个主要转录组簇之间不存在简单的基因组亚类特异性关联。
图4
CovRS双组分系统负调控15%转录组的表达,包括关键的毒力因子。与此一致的是,CovRS的失活增强了毒性。比较了由188株预测野生型菌株、132株具有不同CovRS突变型菌株和122株具有其他主要调节基因型菌株组成的442株菌株的转录物。使用基于距离的聚类验证了转录组数据中可能存在PCA不明显的额外子结构(图5a)(图5b)。
为了验证CovRS菌株与cluster A菌株具有不同转录物的假设,检测了两组基因的转录情况,发现了142个差异表达基因。这两个cluster在差异表达基因以及差异表达基因的转录变化幅度(向上或向下)上存在差异。许多差异表达的基因的转录水平有5倍或更高的变化,包括编码毒力因子的关键SPN和SLO、Mga调节基因。
图5
R28分泌蛋白是一种气体毒性因子,已被作为一种潜在的疫苗进行研究。
R28分泌蛋白由位于 ICE-like元素上的Spy1336/R28基因编码,该基因标记为差异2区(图6)。这37.4 kb的DNA片段与B组链球菌f3染色体上的一个区域>99%相同。对50株菌株的转录组研究中,发现大约三分之一的菌株表达Spyl
336/R28的低水平转录本,而三分之二的菌株高表达Spy 1336/R28的转录本。相邻基因(Spy 1337)表达模式相同(图6b)。
Spy1336/R28和Spyl337 转录水平与遗传结构、地理位置、发病年份或MGE-50基因型之间无相关性。对442株菌株进行全基因组关联研究(GWAS),并对这些菌株的转录组数据进行了整合。
对于两种表型(高和低转录水平),100%在映射到Spy1336/R28和Spy1337之间基因间区域的重要k-mers中,这导致了位于Spy1336/R28和Spy1337基因之间基因间区域的多聚(T)同聚体中的一个变异(图6c)。在这个同源多聚体中插入或删除单个T残基显著改变了转录组Spyl1336/R28和Spyl337的转录水平和株毒力。
图6
emm28菌株的全基因组序列和转录组数据显示差异较大,推测这些基因组和转录组的变化可能导致毒力发生显著变化。SCIA和SCI B菌株的毒力差异不显著(图7a, B),而SC2A菌株毒性明显多于SCIA和SC1B菌株(图7 a, b)。SC2A菌株nca转录水平和SPN活性明显高于SCIA或SCIB菌株(图7c)。
图7
结论
以GAS为模型病原,研究了emm28 S. pyogenes菌株群体基因组学、转录组学和毒力之间复杂的相互作用发现:
1、转录组变化的幅度(差异表达基因的数量)和总基因组与基因组的遗传距离之间没有明显的相关性;
2、Spy1336 / R28转录水平的增加和Spy1337可能增强毒性;
3、在坏死性肌炎小鼠模型中,10T等基因突变株的毒力明显增强,对人多形核中性粒细胞的杀伤能力显著增强,并产生更多分泌的细胞相关的v1336/R28蛋白;
4、基因间区的一个indel与5个基因的表达变化显著相关,其中2个基因在cis (Spy1336/R28和Spyl 337),3个基因在trans (Spy1338, Spy 1339和Spyl340);
5、虽然HGT事件可以改变转录组,但大多数转录组的改变是由SNPs(错义或无义突变)和短缩进引起的,它们影响covR/covS、ropB和mga等主要调控基因,导致同源编码的蛋白被截断;
6、与来自美国的非SC2A菌株相比,来自美国的SC2A菌株与产褥期相关感染的比例要高得多,包含新生儿感染和女性生殖道感染,并且SC2A菌株在小鼠坏死性肌炎中毒性也明显更强。
参考文献:
Kachroo P, Eraso JM . Integrated analysis of population genomics , transcriptomics and virulence provides novel insights into Streptococcus pyogenes pathogenesis. Nat Genet. 2019 Feb 18.