Analyse évolutive du gène gyrA des souches bactériennes Neisseria meningitidis du complexe clonal 4821 recueillies en Chine entre 1978 et 2016

Analyse évolutive de 77 séquences nucléotidiques gyrA des souches CC4821 N.meningitidis

Soixante-dix-sept séquences gyrA de novo de CC4821 N.meningitidis ont été analysées dans le contexte de 149 séquences gyrA publiquement disponibles (énumérées dans le tableau supplémentaire 1). Un arbre phylogénétique de voisinage a été construit avec le jeu de données résultant de 226 séquences nucléotidiques gyrA (Fig. 1). Un arbre similaire a été obtenu en utilisant la méthode du maximum de vraisemblance (ML) (figure supplémentaire 1). Les séquences nucléotidiques étaient significativement divergentes avec une distance p globale de 0,045 (tableau 1). Une vue d’ensemble de l’arbre a montré que les séquences des souches CC4821 de N.meningitidis (en rouge dans la figure 1) se trouvaient à travers l’arbre, ce qui démontre que le gène gyrA était relativement divergent au sein de ces souches.

Fig. 1
figure1

Arbre phylogénétique de jonction des voisins de 226 séquences du gène gyrA provenant de souches de Neisseria. Le nom de la souche est indiqué comme suit : nom de l’espèce-GB ID-souche ID-ST-CC-Sérogroupe-pays de collecte-année de collecte-phénotype de résistance CIP. Les informations manquantes sont indiquées par un espace vide. Par exemple, N.meningitidis-AM889136.1-alpha14-ST53-CC53-cnl-Allemagne-1999 S ; Eikenella corrodens-CP034670.1-KCOM3110—-Corée du Sud-2017. Les noms des séquences des souches CC4821 de N.meningitidis sont indiqués en caractères rouges. Les 77 séquences générées dans cette étude sont soulignées. Les séquences de 9 souches de référence sont indiquées par un point noir. Les valeurs Bootstrap > 70% sont indiquées. Les valeurs Bootstrap < 70% sont indiquées entre parenthèses lorsque cela est nécessaire. Les 9 groupes génétiques identifiés dans cette étude sont indiqués par des lignes verticales entre crochets. Le phénotype de résistance à la CIP est indiqué par R pour résistance, S pour sensible et I pour phénotype de résistance intermédiaire

Tableau 1 Résumé de l’analyse phylogénétique

Parmi les 226 séquences analysées, près de 62% des séquences (140) se sont retrouvées au sommet de l’arbre, sans valeur bootstrap significative (Fig. 1). Ces séquences étaient très homogènes, avec une p-distance de 0,003 (Tableau 1). Les 86 séquences restantes étaient plus divergentes, avec une p-distance de 0,066 par rapport aux séquences regroupées au sommet de l’arbre. La plupart des nœuds concernant ces 86 séquences présentaient une valeur bootstrap > 70%. De plus, la p-distance au sein de ce groupe de 86 séquences était de 0,09, ce qui démontre que ces séquences étaient très divergentes entre elles. Comme les principaux nœuds de l’arbre présentaient une valeur bootstrap > 80%, nous avons décidé d’attribuer arbitrairement les séquences à 9 groupes génétiques différents (Fig. 1 ; Tableau 1). Ces 9 groupes se retrouvaient également dans l’arbre ML (figure additionnelle 1). Les séquences gyrA des souches CC4821 ont été trouvées dans 6 de ces groupes génétiques, à savoir les groupes 1, 2, 3, 5, 6 et 8.

Le groupe 1 était composé de 2 séquences, N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et N.subflava-CP031251.1-M18660—-2009. Ce groupe a été soutenu par un bootstrap de 100% suggérant que ces 2 séquences étaient très différentes du reste des séquences. Les séquences partageaient 7 changements aminés (Tableau 1, Tableau additionnel 2). Cependant, la longue branche correspondant à la séquence N.subflava-CP031251.1-M18660—-2009 a suggéré que cette séquence était également significativement divergente de N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et ceci a été confirmé par une p-distance de 0,06 entre ces 2 séquences (Tableau 1).

Le groupe 2 était composé de 2 séquences provenant de souches de N.meningitidis collectées dans la province de Gansu et Guangxi en Chine en 2007 et 2011, à savoir N.meningitidis-KF733178-G1-ST5636-UA-B-China-2007-R et N.meningitidis-MK930446-GX34173-ST9477-CC4821-B-China-2011.

Le groupe 3 était composé d’une seule séquence, à savoir N.meningitidis-MK930402-231003-ST12300-CC4821-B-China-2009. Le nœud correspondant à cette séquence était soutenu par une valeur bootstrap de 80 %. De plus, la p-distance la plus faible entre cette séquence et les autres séquences analysées était de 0,032 démontrant que cette séquence était significativement divergente par rapport au reste des séquences analysées (Tableau 1).

Le groupe 5 était composé de 26 séquences, principalement de N.meningitidis dont 9 de CC4821. Un sous-groupe de 7 séquences soutenues par un bootstrap de 100% comprenait 5 séquences de N.lactamica. De façon intéressante, N.meningitidis-MK930398-140901-ST8241-CC4821-B-China-2009 s’est regroupé avec des séquences de N.lactamica avec un bootstrap de 100% et une longue branche.

Le groupe 6 était composé de 27 séquences de N.meningitidis (8 de CC4821) et d’une séquence de N. cinerea, à savoir N.cinerea-LS483369.1-NCTC10294, qui partageait un nœud avec N.meningitidis-KF733132-59-ST7962-CC77-NG-China-2009-R. Cependant, la séquence de N.cinerea présentait une longue branche suggérant une divergence significative par rapport à la séquence de N.meningitidis. Sur la base des données disponibles, les séquences du groupe 6 semblaient provenir de souches résistantes à la CIP. Cependant, aucune substitution unique d’acide aminé n’était partagée par ces souches, ce qui suggère qu’il n’y avait pas de marqueur commun pour le phénotype de résistance de ces souches (tableau supplémentaire 2).

Le groupe 8 contenait la plupart des séquences de N.meningitidis (64%) analysées dans ce rapport. Les souches ont été collectées au cours des 88 dernières années dans 13 pays différents de 4 continents. En dépit de la durée importante et de la dispersion géographique, ces séquences étaient hautement conservées avec une distance p de 0,003. De plus, ces séquences provenaient de souches de 68 ST, 24 CC, 9 sérogroupes, y compris la souche de référence 053442. Dans l’ensemble, ces observations ont montré que le gène gyrA était hautement conservé parmi la plupart des souches de N.meningitidis malgré les différentes caractéristiques génétiques, les emplacements géographiques ou le temps de collecte.

Analyse de la divergence au sein de la protéine GyrA

La divergence des acides aminés au sein de la protéine GyrA a été analysée parmi 129 séquences uniques (tableau supplémentaire 2). Deux cent cinquante-sept positions divergentes ont été identifiées parmi les 931 acides aminés figurant dans l’alignement (Fig. 2). Même si ces sites ont été trouvés à travers la protéine, la distribution de la divergence ne semble pas être aléatoire. En effet, deux régions étaient hautement conservées, des positions 530 à 620, et une région plus petite entre 300 et 330. Selon la protéine d’E.coli, la première région correspond à la fin du domaine amino-terminal et au début du domaine carboxy-terminal. La deuxième région correspond au domaine tour de la protéine sur la base de la structure du modèle 3D (Fig. 2).

Fig. 2
figure2

Divergence des acides aminés parmi la protéine GyrA sur la base de 129 séquences uniques. Les positions dans l’alignement long de 932 acides aminés sont indiquées sur l’axe X. Le pourcentage de séquences présentant une position divergente particulière est indiqué sur l’axe Y (côté gauche). Par exemple, 58% des séquences présentent une mutation en position 91. Le graphique de divergence a été généré à partir du tableau des différences d’acides aminés présenté dans le tableau supplémentaire 2. L’alignement présente 10 lacunes et le nombre de séquences présentant des lacunes est indiqué sur l’axe de droite et représenté par un carré noir. Une carte de la protéine GyrA d’E.coli présentant les domaines structurels et fonctionnels est présentée en bas à des fins de comparaison. La carte a été générée à partir des références suivantes. Les séquences de la protéine GyrA d’E.coli et de la souche de référence 053442 de N.meningitidis (GB-ID CP000381) ont été comparées (tableau supplémentaire 4). Les sites connus de résistance à la CIP chez E.coli sont représentés et les positions correspondantes chez N.meningitidis sont indiquées par une ligne bleue. Il convient de noter que parmi les 8 sites résistants signalés chez E.coli, seules les positions 83 et 87 sont divergentes chez N.meningitidis (sites 91 et 95)

Parmi les 257 positions divergentes, aucune n’était partagée par toutes les séquences gyrA analysées des souches CC4821. Cinq sites (91, 417, 665, 210 et 288) étaient fortement divergents, 40% ou plus des 129 séquences étaient mutées à ces positions. Par exemple, 48% des 129 séquences présentaient un résidu muté à la position 417 (Fig. 2). Une position (91) semble être liée à la résistance au CIP, toutes les souches qui n’étaient pas sensibles au CIP étaient mutées à cette position, présentant soit un I ou un F ou un V (tableau additionnel 2).

Identification des marqueurs potentiels de résistance au CIP

Parmi les 226 séquences analysées, 174 provenaient de souches testées pour la résistance au CIP (tableau additionnel 1). Soixante-sept souches ont été testées pour cette étude. Comme mentionné ci-dessus, toutes les souches qui n’étaient pas sensibles à la CIP (soit avec un phénotype résistant (R dans l’arbre) ou un phénotype intermédiaire (I dans l’arbre)) étaient mutées en position 91. Cela a montré qu’une mutation en position 91 était liée au mécanisme de résistance. Parmi les 67 souches testées dans cette étude, 49 étaient mutées en position 91 mais 23 de ces souches avaient un phénotype de résistance intermédiaire. Ceci suggère que d’autres positions pourraient être impliquées dans le mécanisme de résistance. Afin d’identifier d’autres marqueurs potentiels de résistance, les 226 souches ont été analysées plus en détail à chaque position mutée. Un changement qui serait trouvé dans les souches résistantes (y compris le phénotype de résistance intermédiaire) mais qui ne serait trouvé dans aucune souche sensible serait qualifié. Toutefois, pour accroître la rigueur de l’analyse, une mutation trouvée dans une seule souche ne serait pas prise en compte. Au total, 33 sites ont été identifiés (tableau supplémentaire 3 ; partie gauche du tableau supplémentaire 4). Par exemple, H8N a été trouvé dans 18 souches résistantes (dont 2 avec un phénotype intermédiaire) mais ne figure dans aucune souche sensible. Les 226 souches ont été analysées pour ces 33 positions. Une fois de plus, pour accroître la rigueur de l’analyse, une mutation trouvée dans au moins une souche sensible a été écartée. Ainsi, la mutation D95N trouvée dans des souches résistantes et sensibles n’a pas été prise en compte. Au total, 39 mutations (certaines à la même position comme la position 91) ont été analysées (en vert sur le côté gauche du tableau supplémentaire 4). Un profil de mutation a été établi pour les 128 souches présentant au moins une mutation d’intérêt (tableau supplémentaire 3). Quarante-six profils différents ont été identifiés, ce qui signifie qu’il y avait 46 combinaisons de ces 39 mutations parmi toutes les souches analysées (partie droite du tableau supplémentaire 4). Seize des 46 profils de mutation concernaient des souches CC4821 (numéros en rouge dans le tableau supplémentaire 4). Vingt-six profils concernaient des souches connues pour être résistantes à la PIC (noms des souches en caractères bleus dans le tableau supplémentaire 4). Parmi les 39 marqueurs de résistance potentiels, les mutations N103D et T91I étaient les plus partagées dans les profils avec respectivement 29 et 27 apparitions. Cependant, il convient de noter que d’autres mutations étaient également bien représentées comme H8N, I111V, E793Q et A679S avec 23, 21, 18 et 17 apparitions respectivement. Il convient également de noter que 45 % des souches résistantes (58 sur 128) présentaient uniquement la mutation T91I. Les marqueurs de résistance ayant été initialement décrits chez E.coli, une comparaison entre les séquences gyrA d’E.coli et de la souche de référence N.meningitidis 53,442 a été nécessaire afin de vérifier la position de ces marqueurs dans la séquence d’E.coli (Tableau additionnel 5).

Recombinaison au sein du gène gyrA entre N. spp.

L’analyse phylogénétique a permis d’identifier des recombinants potentiels. Ainsi, le groupe 1 présentait un intérêt particulier, concernant N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et N.subflava-CP031251.1-M18660. Ces 2 séquences partageaient 7 changements de résidus, non observés chez les autres souches. De plus, 5 de ces changements ont été observés dans un intervalle de 30 acides aminés (Tableau 1). Enfin, des changements d’acides aminés observés dans une souche n’ont pas été vus dans l’autre souche, comme les positions 740 et 750. Toutes ces observations suggèrent une recombinaison entre ces 2 souches, ce qui a été confirmé par une analyse BootScan (Fig. 3a). Trois autres recombinaisons potentielles ont été confirmées par BootScan. La Fig. 3b décrivait une recombinaison entre une souche CC4821 (probablement soit N.meningitidis-MK930428-421615-ST10235-CC4821-B-China-2016 ou N.meningitidis-CP000381.1-053442-ST4821-CC4821-C-China-2004_R) et N.cinerea-LS483369.1-NCTC10294 —–. La figure 3c présente de multiples événements de recombinaison entre N.lactamica-CP031253.1-M17106—– et deux souches de N.meningitidis, N.meningitidis-KJ415206.1-54-R6—– et N.meningitidis-CP000381.1-53,442-ST4821-CC4821-C-Chine-2004_R. Enfin, une recombinaison entre des souches de N. meningitidis est représentée sur la figure 3d. Dans l’ensemble, l’analyse de recombinaison a montré que le gène gyrA des souches de Neisseria est fortement sujet à la recombinaison.

Fig. 3
figure3

Événements potentiels de recombinaison inter et intra-espèces parmi les souches de Neisseria. a. Recombinaison entre N.subflava et N.meningitidis. Un graphique BootScan a été généré dans SimPlot avec N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 comme requête. b. Recombinaison entre N.cinerea et N.meningitidis. Un graphique BootScan a été généré dans SimPlot avec N.meningitidis-KF733132-59-ST7962-CC77-NG-China-2009-R comme requête. c. Recombinaison entre N.lactamica et N.meningitidis. Un graphique BootScan a été généré dans SimPlot avec N.meningitidis-MK930398-140901-ST8241-CC4821-B-China-2009 comme requête. d. Recombinaison entre les souches de N.meningitidis. Un graphique BootScan a été généré dans SimPlot avec N.meningitidis-MK930446-GX34173-ST9477-CC4821-B-China-2011 comme requête. La souche qui est censée contribuer le plus au processus de recombinaison (dorsale) est représentée par une ligne rouge. La souche de référence N.meningitidis 053442 (GB ID CP000381) est représentée par une ligne noire. Une carte fonctionnelle pour la souche de référence 053442 est présentée ci-dessus, basée sur la carte fonctionnelle d’E.coli présentée dans la Fig. 2

.

Leave a Reply