Evoluční analýza genu gyrA z bakteriálních kmenů Neisseria meningitidis klonálního komplexu 4821 shromážděných v Číně v letech 1978-2016

Evoluční analýza 77 nukleotidových sekvencí gyrA z CC4821 N.meningitidis

Sedmdesát sedm de novo sekvencí gyrA kmenů CC4821 N.meningitidis bylo analyzováno v kontextu 149 veřejně dostupných sekvencí gyrA (uvedených v doplňkové tabulce 1). S výsledným souborem dat 226 nukleotidových sekvencí gyrA byl sestrojen fylogenetický strom spojující sousedy (obr. 1). Podobný strom byl získán pomocí metody maximální věrohodnosti (ML) (Doplňkový obrázek 1). Nukleotidové sekvence se významně lišily s celkovou p-vzdáleností 0,045 (tab. 1). Přehled stromu ukázal, že sekvence z kmenů CC4821 N.meningitidis (na obr. 1 červeně) se nacházely napříč stromem, což ukazuje, že gen gyrA byl v rámci těchto kmenů relativně divergentní.

Obr. 1
obr. 1

Sousední spojovací fylogenetický strom 226 sekvencí genu gyrA z kmenů Neisseria. Název kmene je označen takto: název druhu-GB ID-identifikace kmene-ST-CC-Seroskupina-země sběru-rok sběru-CIP fenotyp rezistence. Chybějící informace jsou označeny prázdným místem. Například: N.meningitidis-AM889136.1-alpha14-ST53-CC53-cnl-Německo-1999 S; Eikenella corrodens-CP034670.1-KCOM3110—-Jižní Korea-2017. Názvy sekvencí z kmenů N.meningitidis CC4821 jsou vyznačeny červeným písmem. Podtrženo je 77 sekvencí vytvořených v této studii. Sekvence 9 referenčních kmenů jsou označeny černou tečkou. Jsou uvedeny hodnoty Bootstrap > 70 %. V případě potřeby jsou v závorce uvedeny hodnoty Bootstrap < 70 %. Devět genetických skupin identifikovaných v této studii je označeno svislými čarami v závorce. Fenotyp rezistence CIP je označen R pro rezistenci, S pro citlivost a I pro střední fenotyp rezistence

Tabulka 1 Shrnutí fylogenetické analýzy

Z 226 analyzovaných sekvencí se téměř 62 % sekvencí (140) nacházelo na vrcholu stromu, přičemž hodnota bootstrapu nebyla významná (obr. 1). Tyto sekvence byly vysoce homogenní, s p-vzdáleností 0,003 (tab. 1). Zbývajících 86 sekvencí bylo více divergentních, s p-vzdáleností 0,066 vzhledem k sekvencím seskupeným na vrcholu stromu. Většina uzlů týkajících se těchto 86 sekvencí se vyznačovala hodnotou bootstrapu > 70 %. Navíc p-vzdálenost v rámci této skupiny 86 sekvencí byla 0,09, což ukazuje, že tyto sekvence byly mezi sebou vysoce divergentní. Vzhledem k tomu, že hlavní uzly stromu vykazovaly bootstrapovou hodnotu > 80 %, rozhodli jsme se libovolně přiřadit sekvence do 9 různých genetických skupin (obr. 1; tab. 1). Těchto 9 skupin se nacházelo i v ML stromu (doplňkový obrázek 1). Sekvence gyrA z kmenů CC4821 byly nalezeny v 6 z těchto genetických skupin, a to ve skupině 1, 2, 3, 5, 6 a 8.

Skupinu 1 tvořily 2 sekvence, N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 a N.subflava-CP031251.1-M18660—-2009. Tato skupina byla podpořena bootstrapem 100 %, což naznačuje, že tyto 2 sekvence byly velmi odlišné od ostatních sekvencí. Sekvence sdílely 7 amino změn (tabulka 1, doplňková tabulka 2). Dlouhá větev odpovídající sekvenci N.subflava-CP031251.1-M18660—-2009 však naznačovala, že i tato sekvence se výrazně liší od sekvence N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005, což bylo potvrzeno p-vzdáleností 0,06 mezi těmito 2 sekvencemi (Tabulka 1).

Skupinu 2 tvořily 2 sekvence z N.meningitidis.meningitidis nasbíraných v provinciích Gansu a Guangxi v Číně v letech 2007 a 2011, a to N.meningitidis-KF733178-G1-ST5636-UA-B-China-2007-R a N.meningitidis-MK930446-GX34173-ST9477-CC4821-B-China-2011.

Skupinu 3 tvořila jediná sekvence, a to N.meningitidis-MK930402-231003-ST12300-CC4821-B-China-2009. Uzel odpovídající této sekvenci byl podpořen hodnotou bootstrapu 80 %. Navíc nejnižší párová vzdálenost mezi touto sekvencí a ostatními analyzovanými sekvencemi byla 0,032, což ukazuje, že tato sekvence byla významně divergentní ve srovnání s ostatními analyzovanými sekvencemi (tabulka 1).

Skupinu 5 tvořilo 26 sekvencí, převážně z N.meningitidis, včetně 9 z CC4821. Podskupina 7 sekvencí podpořená bootstrapem 100 % obsahovala 5 sekvencí z N.lactamica. Zajímavé je, že sekvence N.meningitidis-MK930398-140901-ST8241-CC4821-B-China-2009 se shlukovala se sekvencemi N.lactamica se 100% bootstrapem a dlouhou větví.

Skupinu 6 tvořilo 27 sekvencí z N.lactamica.meningitidis (8 z CC4821) a 1 sekvence z N. cinerea, konkrétně N.cinerea-LS483369.1-NCTC10294, která sdílela uzel s N.meningitidis-KF733132-59-ST7962-CC77-NG-China-2009-R. Sekvence N.cinerea se však vyznačovala dlouhou větví naznačující značnou divergenci ve srovnání se sekvencí N.meningitidis. Na základě dostupných údajů se zdá, že sekvence ze skupiny 6 pocházejí z kmenů, které jsou rezistentní vůči CIP. Tyto kmeny však nesdílely žádnou jedinečnou aminokyselinovou substituci, což naznačuje, že neexistuje žádný společný marker pro fenotyp rezistence těchto kmenů (doplňková tabulka 2).

Skupina 8 obsahovala většinu sekvencí N.meningitidis (64 %) analyzovaných v této zprávě. Kmeny byly shromážděny v posledních 88 letech ve 13 různých zemích ze 4 kontinentů. Navzdory značnému časovému rozpětí a geografickému rozšíření byly tyto sekvence vysoce konzervativní s p-distancí 0,003. Navíc tyto sekvence pocházely z kmenů 68 ST, 24 CC, 9 séroskupin, včetně referenčního kmene 053442. Celkově tato pozorování ukázala, že gen gyrA je vysoce konzervovaný mezi většinou kmenů N.meningitidis navzdory různým genetickým charakteristikám, geografickému umístění nebo době sběru.

Analýza divergence v rámci proteinu GyrA

Aminokyselinová divergence v rámci proteinu GyrA byla analyzována mezi 129 unikátními sekvencemi (Doplňková tabulka 2). Mezi 931 aminokyselinami uvedenými v zarovnání bylo identifikováno dvě stě padesát sedm divergentních pozic (obr. 2). Přestože se tato místa vyskytovala napříč celým proteinem, rozložení divergence se nezdálo být náhodné. Dvě oblasti byly totiž vysoce konzervativní, a to od pozic 530 do 620 a menší oblast mezi pozicemi 300 a 330. V obou případech se jednalo o velmi konzervativní oblasti. Podle proteinu z E.coli odpovídá první oblast konci aminoterminální domény a začátku karboxyterminální domény. Druhá oblast odpovídá věžové doméně proteinu na základě 3D modelové struktury (obr. 2).

Obr. 2
obr. 2

Divergence aminokyselin mezi proteiny GyrA na základě 129 jedinečných sekvencí. Pozice v rámci zarovnání dlouhého 932 aminokyselin jsou vyznačeny na ose X. Procento sekvencí, které se vyznačují určitou divergentní pozicí, je uvedeno na ose Y (na levé straně). Například 58 % sekvencí obsahuje mutaci na pozici 91. Graf divergence byl vytvořen z tabulky rozdílů aminokyselin uvedené v doplňkové tabulce 2. Zarovnání obsahuje 10 mezer a počet sekvencí obsahujících mezery je vyznačen na pravé ose a zobrazen jako černý čtverec. Ve spodní části je pro srovnání zobrazena mapa proteinu E.coli GyrA obsahující strukturní a funkční domény. Mapa byla vytvořena na základě následujících odkazů . Byly porovnány sekvence proteinu GyrA E.coli a referenčního kmene N.meningitidis 053442 (GB-ID CP000381) (Doplňková tabulka 4). Známá místa odolná vůči CIP u E.coli jsou znázorněna a odpovídající pozice u N.meningitidis jsou označeny modrou čarou. Stojí za povšimnutí, že z 8 rezistentních míst uvedených u E.coli jsou u N.meningitidis divergentní pouze pozice 83 a 87 (pozice 91 a 95)

Z 257 divergentních pozic nebyla žádná společná pro všechny analyzované sekvence gyrA kmenů CC4821. Pět míst (91, 417, 665, 210 a 288) bylo vysoce divergentních, na těchto pozicích bylo mutováno 40 % nebo více ze 129 sekvencí. Například 48 % ze 129 sekvencí obsahovalo mutovaný zbytek v poloze 417 (obr. 2). Ukázalo se, že jedna pozice (91) souvisí s rezistencí vůči CIP, všechny kmeny, které nebyly citlivé vůči CIP, byly v této pozici mutovány a obsahovaly buď I, nebo F, nebo V (Doplňková tabulka 2).

Identifikace potenciálních markerů rezistence vůči CIP

Z 226 analyzovaných sekvencí pocházelo 174 z kmenů testovaných na rezistenci vůči CIP (Doplňková tabulka 1). Pro tuto studii bylo testováno 67 kmenů. Jak bylo uvedeno výše, všechny kmeny, které nebyly citlivé na CIP (buď s rezistentním fenotypem (R ve stromu), nebo s intermediárním fenotypem (I ve stromu)), byly mutovány na pozici 91. V případě kmenů s rezistentním fenotypem (R ve stromu) se jednalo o mutace na pozici 91. To ukázalo, že mutace v poloze 91 souvisí s mechanismem rezistence. Ze 67 kmenů testovaných v této studii bylo 49 mutováno v poloze 91, ale 23 z těchto kmenů mělo intermediární fenotyp rezistence. To naznačuje, že do mechanismu rezistence mohou být zapojeny i jiné pozice. Za účelem identifikace dalších potenciálních markerů rezistence bylo 226 kmenů dále analyzováno v každé mutované pozici. Zařadila by se změna, která by byla nalezena u rezistentních kmenů (včetně intermediárního fenotypu rezistence), ale nebyla nalezena u žádného citlivého kmene. Pro zvýšení přísnosti analýzy by však mutace nalezená pouze u jednoho kmene nebyla brána v úvahu. Celkem bylo identifikováno 33 míst (doplňková tabulka 3; levá strana doplňkové tabulky 4). Například H8N byla nalezena v 18 rezistentních kmenech (včetně 2 s intermediárním fenotypem), ale nevyskytovala se v žádném citlivém kmeni. Všech 226 kmenů bylo analyzováno pro těchto 33 pozic. Pro zvýšení přísnosti analýzy byla opět vyřazena mutace nalezená alespoň v jednom citlivém kmeni. Mutace D95N nalezená u rezistentních i citlivých kmenů tedy nebyla dále zvažována. Celkem bylo analyzováno 39 mutací (některé na stejné pozici, jako je pozice 91) (zeleně v levé části doplňkové tabulky 4). Pro 128 kmenů, které obsahovaly alespoň jednu zájmovou mutaci, byl sestaven mutační profil (doplňková tabulka 3). Bylo identifikováno 46 různých profilů, což znamená, že mezi všemi analyzovanými kmeny bylo 46 kombinací těchto 39 mutací (pravá strana Doplňkové tabulky 4). Šestnáct ze 46 mutačních profilů se týkalo kmenů CC4821 (čísla v doplňkové tabulce 4 jsou vyznačena červeně). Dvacet šest profilů se týkalo kmenů, o nichž bylo známo, že jsou rezistentní vůči CIP (názvy kmenů v doplňkové tabulce 4 modrým písmem). Z 39 potenciálně rezistentních markerů se v profilech nejčastěji vyskytovaly mutace N103D a T91I s 29, resp. 27 výskyty. Je však třeba poznamenat, že i další mutace byly hojně zastoupeny, například H8N, I111V, E793Q a A679S s 23, 21, 18 a 17 výskyty. Za zmínku také stojí, že 45 % rezistentních kmenů (58 ze 128) obsahovalo pouze mutaci T91I. Vzhledem k tomu, že markery rezistence byly původně popsány u E.coli, bylo nutné porovnat sekvence gyrA E.coli s referenčním kmenem N.meningitidis 53,442, aby se ověřila pozice těchto markerů v sekvenci E.coli (Doplňková tabulka 5).

Rekombinace v genu gyrA mezi N. spp.

Fylogenetická analýza identifikovala potenciální rekombinanty. Zajímavá byla například skupina 1, týkající se N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 a N.subflava-CP031251.1-M18660. Tyto dvě sekvence měly společných 7 změn reziduí, které nebyly pozorovány u jiných kmenů. Navíc 5 z těchto změn bylo pozorováno v rámci 30 aminokyselin (tabulka 1). A konečně, změny aminokyselin pozorované u jednoho kmene nebyly pozorovány u druhého kmene, jako například pozice 740 a 750. Všechna tato pozorování naznačovala rekombinaci mezi těmito 2 kmeny, což bylo potvrzeno analýzou BootScan (obr. 3a). Další tři potenciální rekombinace byly potvrzeny pomocí BootScan. Na obr. 3b byla popsána rekombinace mezi kmenem CC4821 (pravděpodobně buď N.meningitidis-MK930428-421615-ST10235-CC4821-B-China-2016, nebo N.meningitidis-CP000381.1-053442-ST4821-CC4821-C-China-2004_R) a N.cinerea-LS483369.1-NCTC10294 —–. Na obr. 3c byly znázorněny vícenásobné rekombinační události mezi N.lactamica-CP031253.1-M17106—– a dvěma kmeny N.meningitidis, N.meningitidis-KJ415206.1-54-R6—– a N.meningitidis-CP000381.1-53,442-ST4821-CC4821-C-China-2004_R. Nakonec byla na obr. 3d znázorněna rekombinace mezi kmeny N.meningitidis. Celkově rekombinační analýza ukázala, že gen gyrA kmenů Neisseria je vysoce náchylný k rekombinaci.

Obr. 3
obr. 3

Potenciální mezidruhové a vnitrodruhové rekombinace mezi kmeny Neisseria. a. Rekombinace mezi N.subflava a N.meningitidis. Graf BootScan byl vytvořen v programu SimPlot s N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 jako dotazem. b. Rekombinace mezi N.cinerea a N.meningitidis. V programu SimPlot byl vytvořen graf BootScan s N.meningitidis-KF733132-59-ST7962-CC77-NG-China-2009-R jako dotazem. c. Rekombinace mezi N.lactamica a N.meningitidis. V programu SimPlot byl vytvořen graf BootScan s N.meningitidis-MK930398-140901-ST8241-CC4821-B-China-2009 jako dotazem. d. Rekombinace mezi kmeny N.meningitidis. V programu SimPlot byl vytvořen graf BootScan s N.meningitidis-MK930446-GX34173-ST9477-CC4821-B-China-2011 jako dotazem. Kmen, u kterého se předpokládá, že se bude nejvíce podílet na procesu rekombinace (páteř), je znázorněn červenou čarou. Referenční kmen N.meningitidis 053442 (GB ID CP000381) je zobrazen jako černá čára. Funkční mapa pro referenční kmen 053442 je zobrazena výše na základě funkční mapy E.coli uvedené na obr. 2

.

Leave a Reply