Analyse évolutive du gène gyrA des souches bactériennes Neisseria meningitidis du complexe clonal 4821 recueillies en Chine entre 1978 et 2016
Analyse évolutive de 77 séquences nucléotidiques gyrA des souches CC4821 N.meningitidis
Soixante-dix-sept séquences gyrA de novo de CC4821 N.meningitidis ont été analysées dans le contexte de 149 séquences gyrA publiquement disponibles (énumérées dans le tableau supplémentaire 1). Un arbre phylogénétique de voisinage a été construit avec le jeu de données résultant de 226 séquences nucléotidiques gyrA (Fig. 1). Un arbre similaire a été obtenu en utilisant la méthode du maximum de vraisemblance (ML) (figure supplémentaire 1). Les séquences nucléotidiques étaient significativement divergentes avec une distance p globale de 0,045 (tableau 1). Une vue d’ensemble de l’arbre a montré que les séquences des souches CC4821 de N.meningitidis (en rouge dans la figure 1) se trouvaient à travers l’arbre, ce qui démontre que le gène gyrA était relativement divergent au sein de ces souches.
Parmi les 226 séquences analysées, près de 62% des séquences (140) se sont retrouvées au sommet de l’arbre, sans valeur bootstrap significative (Fig. 1). Ces séquences étaient très homogènes, avec une p-distance de 0,003 (Tableau 1). Les 86 séquences restantes étaient plus divergentes, avec une p-distance de 0,066 par rapport aux séquences regroupées au sommet de l’arbre. La plupart des nœuds concernant ces 86 séquences présentaient une valeur bootstrap > 70%. De plus, la p-distance au sein de ce groupe de 86 séquences était de 0,09, ce qui démontre que ces séquences étaient très divergentes entre elles. Comme les principaux nœuds de l’arbre présentaient une valeur bootstrap > 80%, nous avons décidé d’attribuer arbitrairement les séquences à 9 groupes génétiques différents (Fig. 1 ; Tableau 1). Ces 9 groupes se retrouvaient également dans l’arbre ML (figure additionnelle 1). Les séquences gyrA des souches CC4821 ont été trouvées dans 6 de ces groupes génétiques, à savoir les groupes 1, 2, 3, 5, 6 et 8.
Le groupe 1 était composé de 2 séquences, N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et N.subflava-CP031251.1-M18660—-2009. Ce groupe a été soutenu par un bootstrap de 100% suggérant que ces 2 séquences étaient très différentes du reste des séquences. Les séquences partageaient 7 changements aminés (Tableau 1, Tableau additionnel 2). Cependant, la longue branche correspondant à la séquence N.subflava-CP031251.1-M18660—-2009 a suggéré que cette séquence était également significativement divergente de N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et ceci a été confirmé par une p-distance de 0,06 entre ces 2 séquences (Tableau 1).
Le groupe 2 était composé de 2 séquences provenant de souches de N.meningitidis collectées dans la province de Gansu et Guangxi en Chine en 2007 et 2011, à savoir N.meningitidis-KF733178-G1-ST5636-UA-B-China-2007-R et N.meningitidis-MK930446-GX34173-ST9477-CC4821-B-China-2011.
Le groupe 3 était composé d’une seule séquence, à savoir N.meningitidis-MK930402-231003-ST12300-CC4821-B-China-2009. Le nœud correspondant à cette séquence était soutenu par une valeur bootstrap de 80 %. De plus, la p-distance la plus faible entre cette séquence et les autres séquences analysées était de 0,032 démontrant que cette séquence était significativement divergente par rapport au reste des séquences analysées (Tableau 1).
Le groupe 5 était composé de 26 séquences, principalement de N.meningitidis dont 9 de CC4821. Un sous-groupe de 7 séquences soutenues par un bootstrap de 100% comprenait 5 séquences de N.lactamica. De façon intéressante, N.meningitidis-MK930398-140901-ST8241-CC4821-B-China-2009 s’est regroupé avec des séquences de N.lactamica avec un bootstrap de 100% et une longue branche.
Le groupe 6 était composé de 27 séquences de N.meningitidis (8 de CC4821) et d’une séquence de N. cinerea, à savoir N.cinerea-LS483369.1-NCTC10294, qui partageait un nœud avec N.meningitidis-KF733132-59-ST7962-CC77-NG-China-2009-R. Cependant, la séquence de N.cinerea présentait une longue branche suggérant une divergence significative par rapport à la séquence de N.meningitidis. Sur la base des données disponibles, les séquences du groupe 6 semblaient provenir de souches résistantes à la CIP. Cependant, aucune substitution unique d’acide aminé n’était partagée par ces souches, ce qui suggère qu’il n’y avait pas de marqueur commun pour le phénotype de résistance de ces souches (tableau supplémentaire 2).
Le groupe 8 contenait la plupart des séquences de N.meningitidis (64%) analysées dans ce rapport. Les souches ont été collectées au cours des 88 dernières années dans 13 pays différents de 4 continents. En dépit de la durée importante et de la dispersion géographique, ces séquences étaient hautement conservées avec une distance p de 0,003. De plus, ces séquences provenaient de souches de 68 ST, 24 CC, 9 sérogroupes, y compris la souche de référence 053442. Dans l’ensemble, ces observations ont montré que le gène gyrA était hautement conservé parmi la plupart des souches de N.meningitidis malgré les différentes caractéristiques génétiques, les emplacements géographiques ou le temps de collecte.
Analyse de la divergence au sein de la protéine GyrA
La divergence des acides aminés au sein de la protéine GyrA a été analysée parmi 129 séquences uniques (tableau supplémentaire 2). Deux cent cinquante-sept positions divergentes ont été identifiées parmi les 931 acides aminés figurant dans l’alignement (Fig. 2). Même si ces sites ont été trouvés à travers la protéine, la distribution de la divergence ne semble pas être aléatoire. En effet, deux régions étaient hautement conservées, des positions 530 à 620, et une région plus petite entre 300 et 330. Selon la protéine d’E.coli, la première région correspond à la fin du domaine amino-terminal et au début du domaine carboxy-terminal. La deuxième région correspond au domaine tour de la protéine sur la base de la structure du modèle 3D (Fig. 2).
Parmi les 257 positions divergentes, aucune n’était partagée par toutes les séquences gyrA analysées des souches CC4821. Cinq sites (91, 417, 665, 210 et 288) étaient fortement divergents, 40% ou plus des 129 séquences étaient mutées à ces positions. Par exemple, 48% des 129 séquences présentaient un résidu muté à la position 417 (Fig. 2). Une position (91) semble être liée à la résistance au CIP, toutes les souches qui n’étaient pas sensibles au CIP étaient mutées à cette position, présentant soit un I ou un F ou un V (tableau additionnel 2).
Identification des marqueurs potentiels de résistance au CIP
Parmi les 226 séquences analysées, 174 provenaient de souches testées pour la résistance au CIP (tableau additionnel 1). Soixante-sept souches ont été testées pour cette étude. Comme mentionné ci-dessus, toutes les souches qui n’étaient pas sensibles à la CIP (soit avec un phénotype résistant (R dans l’arbre) ou un phénotype intermédiaire (I dans l’arbre)) étaient mutées en position 91. Cela a montré qu’une mutation en position 91 était liée au mécanisme de résistance. Parmi les 67 souches testées dans cette étude, 49 étaient mutées en position 91 mais 23 de ces souches avaient un phénotype de résistance intermédiaire. Ceci suggère que d’autres positions pourraient être impliquées dans le mécanisme de résistance. Afin d’identifier d’autres marqueurs potentiels de résistance, les 226 souches ont été analysées plus en détail à chaque position mutée. Un changement qui serait trouvé dans les souches résistantes (y compris le phénotype de résistance intermédiaire) mais qui ne serait trouvé dans aucune souche sensible serait qualifié. Toutefois, pour accroître la rigueur de l’analyse, une mutation trouvée dans une seule souche ne serait pas prise en compte. Au total, 33 sites ont été identifiés (tableau supplémentaire 3 ; partie gauche du tableau supplémentaire 4). Par exemple, H8N a été trouvé dans 18 souches résistantes (dont 2 avec un phénotype intermédiaire) mais ne figure dans aucune souche sensible. Les 226 souches ont été analysées pour ces 33 positions. Une fois de plus, pour accroître la rigueur de l’analyse, une mutation trouvée dans au moins une souche sensible a été écartée. Ainsi, la mutation D95N trouvée dans des souches résistantes et sensibles n’a pas été prise en compte. Au total, 39 mutations (certaines à la même position comme la position 91) ont été analysées (en vert sur le côté gauche du tableau supplémentaire 4). Un profil de mutation a été établi pour les 128 souches présentant au moins une mutation d’intérêt (tableau supplémentaire 3). Quarante-six profils différents ont été identifiés, ce qui signifie qu’il y avait 46 combinaisons de ces 39 mutations parmi toutes les souches analysées (partie droite du tableau supplémentaire 4). Seize des 46 profils de mutation concernaient des souches CC4821 (numéros en rouge dans le tableau supplémentaire 4). Vingt-six profils concernaient des souches connues pour être résistantes à la PIC (noms des souches en caractères bleus dans le tableau supplémentaire 4). Parmi les 39 marqueurs de résistance potentiels, les mutations N103D et T91I étaient les plus partagées dans les profils avec respectivement 29 et 27 apparitions. Cependant, il convient de noter que d’autres mutations étaient également bien représentées comme H8N, I111V, E793Q et A679S avec 23, 21, 18 et 17 apparitions respectivement. Il convient également de noter que 45 % des souches résistantes (58 sur 128) présentaient uniquement la mutation T91I. Les marqueurs de résistance ayant été initialement décrits chez E.coli, une comparaison entre les séquences gyrA d’E.coli et de la souche de référence N.meningitidis 53,442 a été nécessaire afin de vérifier la position de ces marqueurs dans la séquence d’E.coli (Tableau additionnel 5).
Recombinaison au sein du gène gyrA entre N. spp.
L’analyse phylogénétique a permis d’identifier des recombinants potentiels. Ainsi, le groupe 1 présentait un intérêt particulier, concernant N.meningitidis-MK930374-100514-ST4832-CC4821-C-China-2005 et N.subflava-CP031251.1-M18660. Ces 2 séquences partageaient 7 changements de résidus, non observés chez les autres souches. De plus, 5 de ces changements ont été observés dans un intervalle de 30 acides aminés (Tableau 1). Enfin, des changements d’acides aminés observés dans une souche n’ont pas été vus dans l’autre souche, comme les positions 740 et 750. Toutes ces observations suggèrent une recombinaison entre ces 2 souches, ce qui a été confirmé par une analyse BootScan (Fig. 3a). Trois autres recombinaisons potentielles ont été confirmées par BootScan. La Fig. 3b décrivait une recombinaison entre une souche CC4821 (probablement soit N.meningitidis-MK930428-421615-ST10235-CC4821-B-China-2016 ou N.meningitidis-CP000381.1-053442-ST4821-CC4821-C-China-2004_R) et N.cinerea-LS483369.1-NCTC10294 —–. La figure 3c présente de multiples événements de recombinaison entre N.lactamica-CP031253.1-M17106—– et deux souches de N.meningitidis, N.meningitidis-KJ415206.1-54-R6—– et N.meningitidis-CP000381.1-53,442-ST4821-CC4821-C-Chine-2004_R. Enfin, une recombinaison entre des souches de N. meningitidis est représentée sur la figure 3d. Dans l’ensemble, l’analyse de recombinaison a montré que le gène gyrA des souches de Neisseria est fortement sujet à la recombinaison.
.
Leave a Reply