Articles / novembre 7, 2021

La promesse du codage à barres de l’ADN pour la taxonomie

Le codage à barres de l’ADN est un nouveau système conçu pour fournir des identifications d’espèces rapides, précises et automatisables en utilisant des régions génétiques courtes et standardisées comme étiquettes internes des espèces. En conséquence, il rendra le système taxonomique linnéen plus accessible, avec des avantages pour les écologistes, les conservateurs et la diversité des agences chargées du contrôle des parasites, des espèces envahissantes et de la sécurité alimentaire. Plus largement, le codage à barres de l’ADN permet d’envisager le jour où tout esprit curieux, du biologiste professionnel à l’écolier, aura facilement accès aux noms et aux attributs biologiques de toutes les espèces de la planète. En plus d’assigner les spécimens à des espèces connues, le codage à barres de l’ADN accélérera le rythme de la découverte des espèces en permettant aux taxonomistes de trier rapidement les spécimens et en mettant en évidence les taxons divergents qui peuvent représenter de nouvelles espèces. En augmentant leurs capacités de cette manière, le codage à barres de l’ADN offre aux taxonomistes la possibilité d’étendre considérablement, et finalement de compléter, un inventaire global de la diversité de la vie.

Malgré les avantages potentiels du codage à barres de l’ADN pour les praticiens et les utilisateurs de la taxonomie, il a été controversé dans certains cercles scientifiques (Wheeler, 2004 ; Will et Rubinoff, 2004 ; Ebach et Holdredge, 2005 ; Will et al., 2005). Certains ont même qualifié le codage à barres de l’ADN d' » anti-taxonomie « , arguant que sa mise en œuvre signera la mort d’un système qui a mis 250 ans à se développer. Nous pensons que cette opposition découle d’idées fausses sur l’effort de codage à barres de l’ADN. C’est pourquoi nous sommes heureux d’avoir l’occasion de clarifier à la fois la raison d’être et les impacts potentiels du codage à barres de l’ADN. En répondant à cet ensemble de questions, nous soulignons les multiples impacts positifs de cette approche pour la science de la taxonomie et de la biodiversité.

Questions

Donné deux milliards de dollars US (le montant qu’un programme complet de codage à barres de l’ADN est estimé coûter ), comment dépenseriez-vous cet argent au profit de la recherche en taxonomie et en biodiversité, et quel serait l’héritage de ces données ?

Cette question ignore une réalité incontournable ; il n’y a aucune perspective d’une infusion unique de 2 milliards de dollars de soutien à un quelconque programme de recherche sur la biodiversité. Un tel niveau d’investissement peut finalement être atteint – mais, si c’est le cas, il reflétera un processus échelonné et géographiquement dispersé de décisions de financement positives qui dépendront fortement à la fois des progrès scientifiques et de la demande sociétale d’identifications au niveau des espèces. Le faible financement consacré jusqu’à présent au codage à barres de l’ADN a donné lieu à une riche moisson de connaissances scientifiques. Ce fait a conduit de nouvelles organisations à fournir le soutien nécessaire pour explorer l’extensibilité de ces résultats à travers le royaume animal. Les premiers résultats positifs de cette deuxième vague d’enquêtes ont maintenant incité des groupes de recherche plus importants à se regrouper. En fait, les premières alliances de portée mondiale ont été constituées pour diriger le développement de bibliothèques de séquences de codes-barres pour tous les oiseaux et poissons. Des segments de groupes beaucoup plus riches en espèces, comme les plantes et les lépidoptères, en sont aux premiers stades de ce processus (www.barcoding.si.edu). Ces groupes de recherche peuvent, à plus long terme, former les unités nucléaires nécessaires pour que l’initiative du code-barres passe dans le domaine de la « grande science » où le succès dépend du couplage d’un programme de recherche clairement énoncé et socialement significatif avec de solides alliances de recherche internationales.

Il est également important de noter que la quête d’un soutien à grande échelle pour le code-barres ADN ne se fait pas au détriment du financement taxonomique. En effet, il est clair que toute campagne réussie pour générer ce soutien se traduira par une infusion substantielle de fonds pour les institutions et les individus engagés dans la recherche taxonomique. Dans l’ensemble, les coûts associés au séquençage de l’ADN ne représenteront qu’une petite partie des efforts de codage à barres de l’ADN ; la majorité du financement sera utilisée pour les efforts de collecte à l’échelle mondiale, pour la conservation des spécimens obtenus et pour le développement de bases de données en ligne contenant des informations détaillées à leur sujet. En outre, il convient de souligner que les fonds déjà acquis proviennent de grandes fondations et d’agences et programmes gouvernementaux qui n’ont aucune tradition de soutien à la recherche taxonomique, et que dans certains cas, les propositions de codage à barres de l’ADN ont été en concurrence directe avec des projets de génomique médicale et comparative plutôt qu’avec des projets liés à la recherche taxonomique. Vu sous cet angle, tout effort de codage à barres de l’ADN à grande échelle représentera une aubaine substantielle, tant sur le plan financier que scientifique, pour la biodiversité et la recherche taxonomique. Il laissera certainement un héritage durable sous la forme d’un système complet et largement accessible pour l’identification des espèces.

A l’échelle mondiale, la recherche taxonomique alpha (la découverte et la description de nouvelles espèces) est en crise. Le codage à barres de l’ADN est-il une solution rapide à ce problème ou accélérera-t-il son déclin ?

À notre avis, le déclin de la taxonomie alpha n’est pas une conséquence de l’utilisation croissante des méthodes moléculaires, comme cela a parfois été suggéré (Wheeler, 2004). En fait, nous nous attendons à ce que le codage à barres de l’ADN aide à la résurgence de la taxonomie. Les programmes de codage à barres de l’ADN vont certainement orienter de nouveaux financements vers la collecte et le catalogage des spécimens. Ils contribueront également aux recherches taxonomiques en aidant à révéler des espèces cryptiques (Hebert et al., 2004a, 2004b), en reliant les sexes et les stades de vie (Beskansky et al., 2003), et en clarifiant les problèmes de synonymie qui consomment actuellement beaucoup d’efforts taxonomiques (Alroy, 2002). La nouveauté et la promesse scientifique du codage à barres de l’ADN susciteront en outre l’intérêt du public pour les questions de taxonomie et de biodiversité, ce qui encouragera les jeunes chercheurs à entrer dans la discipline et les départements universitaires et les agences de gestion de la biodiversité à les embaucher.

Nous sommes convaincus que le codage à barres de l’ADN jouera un rôle de plus en plus important en tant qu’outil de dépistage taxonomique en raison de sa capacité à révéler rapidement les discontinuités génétiques qui séparent habituellement des espèces distinctes (par exemple, Janzen et al., 2005 ; Smith et al., 2005). Son application de cette manière permettra d’inverser les approches taxonomiques standard qui fonctionnent de manière a priori – en recherchant les discontinuités morphologiques qui signalent l’isolement reproductif parmi des assemblages d’organismes non triés. En revanche, le codage à barres de l’ADN permet une approche a posteriori plus efficace, dans laquelle des groupes prédéfinis, génétiquement divergents, sont examinés pour la variation des traits. En ce sens, le codage à barres de l’ADN sera clairement un puissant catalyseur de la taxonomie alpha.

Le chevauchement de la variation des caractères entre et au sein des espèces est bien documenté pour de nombreux systèmes de caractères. Pourquoi est-ce un problème plus ou moins important pour le codage à barres de l’ADN ?

Le chevauchement de la variation de caractères uniques n’est pas problématique pour tout système taxonomique, qu’il soit morphologique ou moléculaire, tant que des caractères multiples sont employés pour le diagnostic du taxon. Un malentendu courant sur le codage à barres de l’ADN est qu’il est basé sur un seul caractère, à savoir « une séquence d’ADN ». En fait, la région du gène de la sous-unité I de la cytochrome c oxydase (cox1 ou COI) de 648 pb utilisée comme code-barres ADN standard pour les membres du règne animal représente un caractère composite complexe impliquant des centaines de composants variant indépendamment. Certains de ces composants sont invariants et, par conséquent, les 648 pb ne sont pas tous informatifs au sein d’un assemblage taxonomique donné, mais la plupart sont variables. Par exemple, nous avons trouvé une variation à 512 des 648 sites dans un grand ensemble de codes-barres de lépidoptères (9715 séquences de 2215 espèces et 1047 genres). Cela signifie que même au sein d’un seul ordre d’insectes, les codes-barres ADN intègrent le schéma des similitudes et des différences entre des centaines de caractères. Dans un certain sens, c’est comme le patronage généré par les écailles sur l’aile d’un papillon de nuit – chaque écaille n’a presque aucune signification, mais le caractère composite du motif de coloration de l’aile est hautement informatif.

Le code-barres d’ADN utilisant une seule région de gènes ne garantit pas une résolution taxonomique complète, mais il promet la proximité. D’après les résultats obtenus dans le passé pour divers groupes d’animaux, le codage à barres de l’ADN permettra une résolution au niveau de l’espèce dans 95 à 97 % des cas (Hebert et al., 2004b ; Janzen et al., 2005 ; Ward et al., 2005). Lorsqu’il échoue, il réduit les options à un petit nombre de taxons congénères (qui, dans de nombreux cas, pourraient être entièrement résolus avec des données génétiques ou autres supplémentaires). Cette performance impressionnante reflète deux observations importantes, et peut-être inattendues : la rareté du partage des séquences mitochondriales entre les espèces et la rareté des divergences profondes des codes-barres au sein des espèces. La variation intraspécifique limitée au sein de divers groupes d’animaux est l’un des premiers résultats clés de l’effort de codification de l’ADN, qui mérite une étude scientifique plus approfondie. Il est certain que le cox1 présente beaucoup moins de variations au sein des espèces que ce que certains critiques avaient prévu (par exemple, Mallet et Willmott, 2003), ce qui peut refléter l’impact des balayages sélectifs liés à la coévolution des génomes nucléaires et mitochondriaux. Fait important, pour l’utilisation des codes-barres comme identificateurs au niveau des espèces, les différences de codes-barres semblent s’accumuler rapidement, ce qui permet de distinguer toutes les espèces sœurs, sauf les plus jeunes.

Nous reconnaissons à la fois l’utilité générale des données génétiques dans les études taxonomiques et la forte concordance des signaux taxonomiques provenant de différents gènes. Cependant, nous soulignons qu’il n’existe pas de « code-barres ADN informel ». Un code-barres d’ADN n’est pas n’importe quelle séquence d’ADN : il s’agit d’une séquence rigoureusement normalisée, d’une longueur et d’une qualité minimales, provenant d’un gène convenu, déposée dans une grande base de données de séquences et attachée à un spécimen de référence dont les origines et le statut actuel sont enregistrés. En fait, il a déjà été établi que seules les séquences de cox1 qui répondent à ces critères stricts seront désignées comme codes-barres ADN par la GenBank du National Center for Biotechnology Information (NCBI, GenBank ; www.ncbi.nlm.nih.gov/Genbank), le Laboratoire européen de biologie moléculaire (EMBL ; www.embl.org), et la Banque de données ADN du Japon (DDBJ ; www.ddbj.nig.ac.jp).

Il existe une distinction importante entre « décrire » et « délimiter » les espèces, mais une confusion entre les deux a créé un malaise quant à l’utilisation des codes-barres ADN comme base des futures descriptions taxonomiques. Nous insistons sur le fait que le codage à barres de l’ADN ne vise qu’à faciliter la délimitation des espèces, en mettant en évidence des groupes génétiquement distincts présentant des niveaux de divergence de séquence suggérant le statut d’espèce. En revanche, les codes-barres ADN ne sont jamais suffisants pour décrire de nouvelles espèces. À un moment donné, des codes-barres d’ADN clairement divergents, combinés à d’autres informations, seront utilisés comme base pour fournir un nouveau nom linnéen (Smith et al., 2005) et, comme pour toute hypothèse taxonomique, ils seront soumis à une réévaluation continue. Par exemple, dans une étude récente sur les oiseaux d’Amérique du Nord, le seuil de délimitation de nouvelles espèces probables a été arbitrairement fixé à 10 × la variation moyenne au sein de l’espèce de l’ensemble des données du code-barres. Cela a conduit à la révélation de quatre nouvelles espèces présumées (Hebert et al., 2004b), mais les décisions concernant la reconnaissance officielle de ces taxons sont laissées, à juste titre, à la communauté ornithologique (notamment, les informations morphologiques et comportementales existantes soutiennent ces nouvelles hypothèses). La synergie entre le codage à barres de l’ADN et les études de la diversité morphologique/écologique est illustrée par le cas du papillon hespérie, Astraptes fulgerator, pour lequel une approche combinant morphologie, histoire naturelle et codage à barres a révélé un complexe de 10 espèces dans une petite région du Costa Rica. Fait important, plusieurs de ces espèces ont montré une divergence de code-barres relativement faible, mais un couplage de cette information avec des enregistrements sur les plantes hôtes larvaires et la morphologie a éclairé toute la diversité du complexe (Hebert et al., 2004a).

Les gènes de codage-barres proposés peuvent échouer à récupérer des arbres d’espèces précis. Est-ce important pour le codage à barres de l’ADN ?

Nous soulignons que les codes à barres de l’ADN ne visent pas à récupérer les relations phylogénétiques ; ils cherchent plutôt à identifier les espèces connues et à aider à la découverte de nouvelles espèces. Malgré ce fait, certains opposants ont affirmé que le codage à barres de l’ADN échoue en tant qu’approche taxonomique parce qu’il ne récupère pas toujours des arbres d’espèces précis (par exemple, Will et Rubinoff, 2004). Il est important à cet égard de souligner que les placements taxonomiques actuels doivent être considérés comme des hypothèses et non comme des faits. Prenons un exemple primaire offert par Will et Rubinoff (2004) dans leur critique des codes-barres ADN : à savoir que les codes-barres ADN suggèrent une affinité très étroite entre le papillon de nuit Simyra henrici et certaines espèces d’Acronicta (Hebert et al., 2003). Will et Rubinoff (2004:48) soutiennent que ce placement rend « impossible la récupération de toute information taxonomique en dessous du niveau supragénérique, pas même l’appartenance à un genre ». Cependant, plutôt que de refléter un échec du codage à barres de l’ADN, nous pensons que ce cas illustre le pouvoir de l’approche pour éclairer les attributions taxonomiques qui doivent être examinées. Le placement traditionnel de S. henrici dans un genre distinct reflète le fait que ses adultes ont des ailes antérieures jaune pâle, montrant une divergence frappante avec les ailes antérieures grises/noires des espèces Acronicta. Pourtant, la morphologie larvaire, les motifs des ailes antérieures des adultes, la niche écologique et l’anatomie génitale suggèrent tous que S. henrici a des affinités étroites avec Acronicta oblinata (D. Wagner, communication personnelle), une conclusion renforcée par les codes-barres ADN (Fig. 1). La coloration distinctive de ses ailes antérieures reflète probablement le fait que les larves de S. henrici se nourrissent d’herbes, par opposition aux habitudes de consommation d’arbres des espèces typiques d’Acronicta. Un changement rapide de la couleur des ailes a vraisemblablement été induit par la sélection naturelle pour faciliter l’adaptation au substrat pendant la vie adulte. Ainsi, cet exemple particulier révèle non seulement la capacité du codage à barres de l’ADN à affiner les hypothèses taxonomiques existantes, mais aussi à fournir de nouvelles informations sur les trajectoires évolutives (voir Janzen et al, 2005, pour d’autres exemples impliquant des lépidoptères tropicaux).

Figure 1

Arbre d’identification des taxons généré par l’analyse de voisinage des distances K2P montrant les modèles de divergence des séquences cox1 pour 31 espèces d’Acronicta et 1 espèce de Simyra. Les spécimens provenant de différentes provinces (Canada) ou de différents États (États-Unis) sont représentés par des couleurs différentes.

Figure 1

Arbre d’identification des taxons généré par une analyse de voisinage des distances K2P montrant les modèles de divergence des séquences cox1 pour 31 espèces d’Acronicta et 1 espèce de Simyra. Les spécimens provenant de différentes provinces (Canada) ou états (USA) sont représentés par des couleurs différentes.

Certaines espèces ne sont pas mitochondrialement monophylétiques, partageant des polymorphismes avec des taxons non apparentés. Comment cela affectera-t-il les identifications utilisant une approche de codage à barres ?

Bien que l’échange horizontal de mitochondries entre des organismes taxonomiquement divergents puisse théoriquement se produire, aucune preuve n’a été trouvée parmi les milliers d’espèces animales qui ont maintenant été codées à barres. Des séquences mitochondriales partagées (et donc des codes-barres) ont été observées, mais uniquement parmi des espèces étroitement apparentées et vraisemblablement à la suite d’une hybridation continue. Les impacts taxonomiques de ce partage sont loin d’être catastrophiques – ils limitent les identifications à un petit complexe de congénères. Les codes-barres partagés ne représentent pas un problème taxonomique substantiel parce qu’ils sont peu fréquents et que leurs impacts sont paroissiaux.

Il convient de souligner que les tests critiques du partage de séquences mitochondriales entre espèces sont difficiles à exécuter. De nombreuses études présument que les divergences entre les identifications effectuées à l’aide de traits morphologiques et de codes-barres ADN signalent des défauts dans les données du code-barres. Avant d’accepter de manière critique de telles conclusions, une validation plus solide des attributions basées sur la morphologie est nécessaire. Par exemple, Wahlberg et al. (2003) ont signalé des conflits entre la morphologie et les divergences d’ADN mitochondrial dans un complexe d’espèces de papillons étroitement alliées, mais cette conclusion aurait été bien plus solide si les attributions morphologiques avaient été confirmées indépendamment par plusieurs taxonomistes (bien qu’elles puissent encore refléter une hypothèse taxonomique erronée). Il convient de noter que des tests en aveugle du codage à barres de l’ADN ont été effectués à plusieurs reprises. En effet, le codage à barres de l’ADN a réussi des tests en double aveugle, dans lesquels le taxonomiste fournissant les spécimens ne se rendait pas compte de toute la diversité des espèces présentes dans un échantillon (c’est-à-dire jusqu’à ce qu’un examen plus approfondi inspiré par les résultats du codage à barres révèle des différences biologiques essentielles entre elles ; par exemple, Hebert et al., 2004a, 2004b). Fournir des démonstrations empiriques que les codes-barres ADN sont capables d’identifications cohérentes, précises et sans ambiguïté est un aspect essentiel de la recherche sur les codes-barres, et on devrait s’attendre à la même chose des approches alternatives.

Si l’achèvement d’un programme de codage à barres de l’ADN se produisait un jour, cela marquerait-il le début ou la fin de la recherche taxonomique et de la biodiversité, et quel sera le rôle des systématiciens dans un monde où la plupart des identifications se font par « code à barres » ?

Le codage à barres de l’ADN augmentera l’échelle et le succès de la science de la biodiversité en augmentant considérablement l’accès aux identifications d’espèces. Un système automatisé basé sur l’ADN libérera les taxonomistes des identifications de routine, leur permettant de diriger leurs efforts vers de nouvelles collections, des descriptions et des évaluations des relations taxonomiques. Certains opposants au codage à barres de l’ADN ont fait valoir que les identifications de routine ne représentent qu’une partie mineure du travail d’un taxonomiste (Lipscomb et al., 2003 ; Wheeler, 2004 ; Will et Rubinoff, 2004), tandis que d’autres ont loué l’utilité potentielle des systèmes d’identification automatisés, mais seulement s’ils sont basés sur la morphologie (Gaston et O’Neill, 2004 ; Wheeler, 2004). Nous pensons que les identifications d’espèces sont une étape limitant le rythme de nombreuses enquêtes écologiques et de biodiversité, ainsi que de la recherche taxonomique, et que le codage à barres de l’ADN permettra donc à la fois de soulager un fardeau pour les taxonomistes et de répondre à un besoin actuel avec des avantages importants pour la taxonomie et la science de la biodiversité.

Dans un monde codé à barres, les taxonomistes conserveront leur rôle de leader dans l’association, l’intégration et l’interprétation des connaissances sur la variation de l’état des caractères qui délimite les espèces et ce que cela implique pour la taxonomie de niveau supérieur. Comme indiqué précédemment, leur travail sur les nouveaux assemblages de la vie peut souvent être accéléré en utilisant les résultats des codes-barres pour permettre une approche a posteriori de la reconnaissance des espèces. Bien entendu, les taxonomistes continueront également à exploiter d’autres approches moléculaires et morphologiques pour explorer des relations taxonomiques plus profondes.

L’expansion inévitable des efforts de séquençage qui viendrait avec un programme de codage à barres de l’ADN serait-elle concomitante avec une baisse de la qualité de la recherche taxonomique ?

Il a été suggéré que le séquençage est trop coûteux, difficile ou long pour les taxonomistes (par ex, Dunn, 2003 ; Mallet et Willmott, 2003 ; Seberg et al., 2003). Cependant, les taxonomistes individuels ne sont pas plus tenus de réaliser leur propre séquençage que les photographes individuels n’ont besoin de développer leurs propres photographies. Le codage à barres est déjà passé au stade du » photomat « , avec des dizaines de milliers de spécimens analysés à faible coût dans des installations de codage à barres à grand volume (par exemple, à l’Université de Guelph, au Canada, et à la Smithsonian Institution, aux États-Unis). Le « fardeau » direct des collaborateurs taxonomiques consiste à alimenter le train de l’analyse en fournissant de petits échantillons de tissus provenant de spécimens identifiés et certifiés pour le codage à barres. Avec la maturation des technologies microfluidiques au cours de la prochaine décennie, on peut s’attendre à la mise au point d’appareils abordables, conviviaux, compacts, voire portables, qui intègrent toutes les étapes, de l’extraction de l’ADN à l’analyse de la séquence du code-barres pour obtenir une identification (un mouvement vers l’étape du « Polaroid » dans l’analogie avec la photographie). Bien que nous puissions nous attendre à ce que de tels instruments deviennent un équipement standard à la fois pour la recherche taxonomique et pour la communauté plus large des organisations et des individus qui ont besoin d’un accès rapide aux identifications d’espèces, cela n’implique certainement pas que le codage à barres transformera les taxonomistes en biologistes moléculaires.

Nous pensons que les outils fournis par le codage à barres de l’ADN ajouteront de la rigueur à la génération et à la vérification des hypothèses taxonomiques. La taxonomie a généralement été exécutée en utilisant des discontinuités dans les traits analogues (c’est-à-dire morphologiques gradués) pour déduire les frontières des espèces, une approche qui a généré un total de 1,7 million d’hypothèses taxonomiques sur 250 ans. Le codage à barres de l’ADN permet de vérifier ces hypothèses à l’aide d’un flux de données numériques indépendant (c’est-à-dire basé sur les nucléotides de l’ADN). Bien qu’il y ait eu une bonne correspondance entre les espèces reconnues par des approches morphologiques et les désignations basées sur les codes à barres, il existe des discordances. Ces cas doivent être accueillis favorablement car ils renforcent à la fois les hypothèses taxonomiques et les méthodes d’analyse des différences entre les codes-barres, et peuvent conduire à de nouvelles découvertes concernant l’évolution et l’écologie. Tous ces avantages ont été mis en évidence dans les premiers efforts de codage à barres.

En supposant que les problèmes techniques du codage à barres de l’ADN puissent être surmontés, est-il maintenant, ou sera-t-il jamais rentable par rapport aux méthodes traditionnelles d’utiliser les codes à barres de l’ADN à des fins de bioinventaire ?

Un avantage majeur du codage à barres de l’ADN, et sa justification, réside dans sa rentabilité pour l’identification des espèces, en particulier dans les programmes ambitieux de bioinventaire et de biosurveillance (Smith et al., 2005). À l’heure actuelle, les systèmes de production permettant d’identifier ne serait-ce qu’un petit groupe d’espèces parfaitement connues par le biais d’approches morphologiques coûtent environ 2 $ par spécimen (p. ex. les programmes de surveillance des moustiques qui portent sur moins de 60 espèces ; F. C. Hunter, communication personnelle). Lorsqu’une équipe de spécialistes taxonomiques cible un plus grand assemblage d’espèces dans une zone géographique spécifique, les coûts augmentent considérablement et l’identification de spécimens uniques peut coûter de 50 à 100 $ si tous les coûts sont internalisés. Aujourd’hui, un code-barres ADN peut être généré pour environ 5 dollars par spécimen, y compris la main-d’œuvre et le séquençage, et ce coût devrait s’effondrer. Avec le temps, les programmes de codes-barres ADN ont le potentiel de devenir autosuffisants en facturant une petite somme pour les identifications tout en maintenant un accès libre pour les chercheurs universitaires.

Le coût n’est qu’un critère pour évaluer l’utilité d’un système de soutien taxonomique pour la recherche sur la biodiversité. La vitesse, la fiabilité et l’accessibilité sont tout aussi importantes, et nous pensons que le codage à barres de l’ADN excelle dans ces domaines. En revanche, même les programmes de biosurveillance à petite échelle basés sur la morphologie sont actuellement confrontés à un défi majeur : fournir des résultats de manière rapide et rentable. Cela peut avoir des conséquences économiques dramatiques, comme dans le cas de la difficulté actuelle à identifier les espèces envahissantes suffisamment tôt pour supprimer une épidémie. Pourtant, les avantages économiques de l’exclusion d’un seul envahisseur nocif, comme la moule zébrée d’Amérique du Nord, auraient été suffisants après une décennie pour coder à barres la plupart des espèces animales sur Terre.

Nous sommes d’accord pour dire que la science axée sur les hypothèses domine les concours de financement à petite échelle et que la taxonomie s’en tire mal en raison de sa nature axée sur les découvertes. D’un autre côté, toutes les initiatives de « grande science » – de la physique subatomique au génome humain en passant par l’exploration spatiale – ont été axées sur la découverte, et ce sera l’arène de financement dans laquelle le programme mondial de codage à barres de l’ADN fonctionnera s’il relève le défi. Comme pour la plupart des grands projets scientifiques, le codage à barres de l’ADN a fait l’objet d’affirmations selon lesquelles il « n’est pas de la science » et qu’il menace la capacité des petits laboratoires à mener des recherches fondées sur des hypothèses. Dans le passé, ces affirmations se sont toujours révélées à courte vue. L’observation répétée est que la science de la découverte à grande échelle fait jaillir des hypothèses à un rythme frénétique et révèle des pistes d’investigation qui n’auraient jamais pu être anticipées. En ce sens, de nombreuses critiques formulées à l’encontre du codage à barres de l’ADN sont remarquablement similaires à celles formulées il y a dix ans à l’égard du projet du génome humain.

Le codage à barres de l’ADN a déjà réussi à attirer un financement substantiel de la part de diverses agences et organisations qui n’ont pas été des bailleurs de fonds traditionnels de la taxonomie, mais cela n’a pas été accompli en vendant la « taxonomie » en soi. Au contraire, l’initiative de codage à barres de l’ADN promeut la vision d’un inventaire largement accessible de la diversité de la vie. Ce n’est qu’en soulignant les avantages pour la société et en suscitant l’intérêt des contribuables que l’on obtiendra le soutien d’une initiative mondiale en faveur de la biodiversité. Bien entendu, cela ne signifie pas que la taxonomie est appelée à devenir une « industrie de services de haute technologie » pour d’autres biologistes, comme certains l’ont suggéré (par exemple, Lipscomb et al., 2003 ; Wheeler, 2004 ; Will et Rubinoff, 2004). Un objectif majeur du codage à barres de l’ADN est de permettre à la majorité non-taxonomiste des biologistes – et en fait, à n’importe qui – d’accéder directement aux informations taxonomiques tout en permettant aux taxonomistes professionnels de se concentrer sur la génération d’un plus grand nombre de ces connaissances.

Déclaration de position

Les efforts pour inventorier la diversité eucaryote par des analyses morphologiques ont connu beaucoup de succès. La génération de près de deux millions d’hypothèses taxonomiques au cours des 250 dernières années est un exploit impressionnant qui a fourni une compréhension fondamentale de la diversité biologique, mais de nombreux détails attendent d’être clarifiés. Le codage à barres de l’ADN peut contribuer à l’inventaire de la vie en accélérant la découverte d’espèces, en testant les hypothèses taxonomiques actuelles et en facilitant l’identification des espèces. Ces contributions ne se feront pas au détriment des valeurs taxonomiques fondamentales ou du financement. Le codage à barres de l’ADN ne cherche pas à abandonner » les études morphologiques au profit d’un système d’identification étroit et entièrement moléculaire » (Will et Rubinoff, 2004 : 47). Il s’efforce plutôt de créer des alliances entre les taxonomistes moléculaires et morphologiques (Hebert et Barrett, 2005). Elle cherche également à préserver les principes linnéens selon lesquels les espèces sont nommées et classées. Le codage à barres de l’ADN nécessite des noms d’espèces existants, dérivés de la morphologie, pour la calibration, et ce sont ces noms qui sont récupérés lorsque le codage à barres est utilisé pour l’identification.

Il est généralement admis que l’étude de la biodiversité est sérieusement sous-financée (Godfray, 2002). Il n’est pas facile d’attribuer cela au thème d’investigation, car la science de la biodiversité est importante et suscite beaucoup d’intérêt de la part du public. Cependant, ce domaine de recherche souffre d’une culture du conflit. Plutôt que de mettre en place de grandes collaborations, la communauté de la biodiversité a une tradition de polarisation et de luttes intestines. Le codage à barres de l’ADN n’est pas étranger aux invectives : il a été qualifié de » technologie théoriquement vide » et de » tour de passe-passe » (Wheler, 2004 ; Will et al., 2005). Le couplage de tels commentaires avec des attaques ad hominem contre les partisans du codage à barres de l’ADN n’apporte que peu de crédit à la discipline.

Certains critiques accusent l’approche du codage à barres de l’ADN d’être fondamentalement défectueuse, mais les données disponibles racontent une histoire très différente : le succès du codage à barres de l’ADN a jusqu’à présent été étonnamment impressionnant. Comme le fait remarquer Smith (2005), le codage à barres a donné de bons résultats lors d’un test effectué à la conférence PEET. Plus important encore, une série d’études ont maintenant examiné l’efficacité du codage à barres de l’ADN dans des assemblages d’espèces provenant de divers contextes géographiques et de nombreux groupes taxonomiques ayant des attributs divergents en matière de cycle de vie et d’évolution. Suite à ces tests de sensibilité, des enregistrements de codes-barres sont désormais disponibles pour plus de 13 000 espèces animales (et s’accumulent rapidement) et ils révèlent une résolution qui n’est pas illusoire (www.barcodinglife.org). Groupe après groupe, le succès de l’identification des espèces dépasse les 95% et les quelques cas de résolution compromise impliquent l’incapacité de discriminer un petit groupe d’espèces étroitement alliées (Hebert et al., 2004a, 2004b ; Hebert et al., non publié). Les résultats typiques ressemblent à ceux de la figure 1, qui montre le schéma des divergences des codes-barres d’ADN pour 31 espèces d’Acronicta, l’un des genres de lépidoptères les plus diversifiés d’Amérique du Nord. Dans ce cas, il n’y a pas d’évidence de partage de séquence entre les taxons, ce qui serait attendu si l’hybridation se produisait ou si les espèces étaient trop jeunes pour être discriminées. Au lieu de cela, il y a une séparation nette des espèces avec une cohésion du code-barres pour les conspécifiques, même lorsqu’ils dérivent de sites disparates dans l’est de l’Amérique du Nord.

Il n’y a rien d’exceptionnel dans les résultats du code-barres pour Acronicta – des études sur les invertébrés du sol de l’Arctique et sur les lépidoptères des tropiques montrent un succès similaire dans la résolution des espèces (Hogg et Hebert, 2004 ; Janzen et al., 2005). Cette performance s’étend aux milieux marins : une étude sur les codes-barres qui a examiné plus de 200 espèces de poissons australiens morphologiquement définies a généré un taux de réussite de 100 % dans leur discrimination (Ward et al., 2005). Des tests de sensibilité sur des gradients de 10 fois les taux d’évolution mitochondriale ont révélé un succès élevé dans l’identification d’espèces de groupes d’insectes présentant à la fois les taux d’évolution les plus faibles et les plus élevés (Ball et al., 2005 ; Smith et al., 2005). Les changements dans la composition nucléotidique du génome mitochondrial n’ont pas non plus d’impact sur la résolution du codage à barres de l’ADN, comme le montre le succès obtenu dans des groupes, tels que les oiseaux, avec une composition G+C élevée et d’autres, tels que les araignées, avec un biais A+T extrême (Hebert et al., 2004b ; Barrett et Hebert, 2005).

Si ces études passées sont le reflet de la performance générale des codes-barres à travers le royaume animal, un système complet basé sur le cox1 offrira une résolution taxonomique supérieure à 99,99% lorsqu’il est considéré dans une perspective à l’échelle du royaume. Pour comprendre cela, il suffit d’imaginer que chacune des 10 000 fosses de la figure 2 est un dépôt de données de codes-barres d’une seule espèce. En supposant qu’il existe 10 millions d’espèces animales, la bibliothèque de codes-barres de ce royaume pourrait être représentée par seulement 1000 de ces pages. L’avifaune mondiale, qui se compose d’environ 10 000 espèces d’oiseaux, n’occupera qu’une seule de ces pages. Les codes-barres des poissons du monde entier occuperont trois pages, tandis que les coléoptères rempliront plusieurs centaines de pages. Une fois que les 10 millions de puits auront été remplis de données de codes-barres, l’analyse de toute nouvelle séquence de codes-barres fournira un transport immédiat vers la page correcte sur 1000, offrant une résolution de 99,9%. En fait, sur la base des données relatives aux oiseaux d’Amérique du Nord, la séquence de codes-barres fournira une résolution parfaite en conduisant à une case d’espèce individuelle sur la page unique de l’oiseau dans 96 % des cas. Dans les autres cas, le code-barres nouvellement recueilli correspondra aux séquences de deux ou trois cases adjacentes. En résumé, un code-barres court effondrera l’incertitude de l’identité de l’espèce de l’une quelconque des 10 millions d’espèces à une seule espèce dans la plupart des cas, et à un petit sous-ensemble d’espèces étroitement alliées dans d’autres cas.

Figure 2

Représentation graphique d’une matrice qui stockerait des données de codes-barres sur 10 000 espèces (par exemple, presque toutes les espèces d’oiseaux connues). Mille pages de ce type abriteraient les enregistrements de codes-barres de 10 millions d’espèces. En plus de fournir une épithète d’espèce, un tel système agirait comme un portail vers toutes les autres informations collectées sur une espèce donnée en se connectant à d’autres bases de données biologiques complètes.

Figure 2

Représentation graphique d’une matrice qui stockerait des données de code-barres sur 10 000 espèces (par exemple, presque toutes les espèces d’oiseaux connues). Mille pages de ce type abriteraient les enregistrements de codes-barres de 10 millions d’espèces. En plus de fournir une épithète d’espèce, un tel système agirait comme un portail vers toutes les autres informations collectées sur une espèce donnée en se connectant à d’autres bases de données biologiques complètes.

Le financement est maintenant en place pour garantir que la bibliothèque de codes-barres ADN pour les animaux augmentera d’au moins 500 000 enregistrements au cours des 5 prochaines années, fournissant une couverture pour environ 50 000 espèces. Bien que cela soit loin de constituer un registre complet des espèces, cela permettra aux codes-barres ADN de fonctionner comme un outil d’identification efficace pour les groupes taxonomiques pour lesquels les enregistrements de codes-barres sont complets. Par exemple, lorsque la couverture des codes-barres pour les poissons, les oiseaux et les insectes nuisibles sera presque complète, cela permettra un accès ouvert à l’identification de ces espèces, quel que soit leur stade de vie ou leur état. Au fur et à mesure que ce noyau d’enregistrements d’espèces sera rejoint par les codes-barres d’autres animaux, un système d’identification global pour ce règne de la vie verra le jour.

Bien que nous pensions que la généralité du code-barres a maintenant été démontrée pour le règne animal, il reste un besoin à la fois d’établir et d’évaluer les protocoles de code-barres pour les autres règnes de la vie. Les principes fondamentaux de l’analyse des codes-barres (minimisation et standardisation des cibles de séquences) sont sûrement applicables à ces organismes, mais la sélection des régions génétiques et les tests de leur efficacité restent en cours, bien que les premiers résultats sur les plantes (Kress et al., 2005) et les protistes (G.W. Saunders, communication personnelle) incitent à l’optimisme. Outre son succès dans la séparation des espèces connues, le codage à barres de l’ADN sera une aide puissante pour résoudre d’autres problèmes taxonomiques. Des espèces oubliées ont été régulièrement révélées, même dans des groupes bien étudiés comme les oiseaux nord-américains (Hebert et al., 2004b), les papillons (Hebert et al., 2004a) et les papillons de nuit (Janzen et al., 2005). Son rôle dans l’association des stades de vie (Beskansky et al., 2003) et des sexes (Janzen et al., 2005), et dans la clarification des synonymies, sera également utile dans de nombreuses autres enquêtes taxonomiques.

L’activation de tout programme scientifique majeur exige non seulement une solide justification scientifique, mais aussi une démonstration de la pertinence sociétale. Le codage à barres de l’ADN présente une telle pertinence en fournissant un nouvel accès aux identifications dans des contextes variés. Les efforts de conservation de la vie sont actuellement limités par le besoin d’un système d’identification, et nous pensons que ce besoin ne peut être satisfait que par le codage à barres de l’ADN (voir également Smith et al., 2005). La capacité des codes-barres à identifier des fragments de vie a des applications allant de la résolution de cas de substitution d’espèces sur le marché (Marko et al., 2004) à la protection de la sécurité alimentaire en passant, par exemple, au crible des déchets de ruminants dans les aliments pour animaux. Plus généralement, la capacité du codage à barres de l’ADN à fournir des identifications rapidement et à moindre coût a le potentiel de révolutionner la relation de l’humanité avec la diversité biologique (Janzen, 2004).

Si le codage à barres de l’ADN se déroule à grande échelle, il générera des sous-produits importants pour la communauté scientifique. Tous les extraits d’ADN produits au cours de l’analyse du code-barres des spécimens justifiés seront stockés, ce qui permettra des efforts futurs pour examiner les modèles de diversité de séquence dans d’autres régions génétiques, et les programmes de collecte instigués par le code-barres de l’ADN augmenteront les spécimens disponibles pour l’analyse morphologique. L’initiative du code-barres créera également un système basé sur le Web qui permettra non seulement des identifications automatisées, mais fournira également un portail d’accès aux informations biologiques pour toutes les espèces incluses dans le registre. Bien que le codage à barres de l’ADN ne créera pas l' »encyclopédie de la vie », il générera son index et sa table des matières.

En raison à la fois des résultats scientifiques positifs et de ses avantages sociétaux reconnus, il y a un enthousiasme croissant pour une initiative de codage à barres de l’ADN à grande échelle. Deux réunions à Cold Spring Harbor en 2003 ont permis de clarifier les plans d’action (Stoeckle, 2003), et d’autres réunions ont suivi. La plus récente, qui a été organisée par le Natural History Museum de Londres, a attiré plus de 230 chercheurs (Marshall, 2005). Le mouvement des codes-barres dispose également d’une force d’organisation centrale : le Consortium for the Barcode of Life (CBOL), hébergé par la Smithsonian Institution à Washington, qui a été lancé à la mi-2004. Plus de 80 organisations de 25 nations, dont de nombreux musées de renom, ont déjà rejoint CBOL (www.barcoding.si.edu). Les premières campagnes mondiales de codes-barres ont été lancées sous ses auspices ; il est notamment prévu d’attribuer un code-barres aux 10 000 espèces d’oiseaux et aux 15 000 poissons marins d’ici 2010. Il est clair que le travail doit s’étendre au-delà des laboratoires individuels pour s’attaquer à des projets majeurs tels que ceux-ci, et des réseaux nationaux de codes-barres sont en train de se former pour établir des chaînes d’approvisionnement en spécimens et pour superviser les installations analytiques de base. Le premier d’entre eux, le Réseau canadien du code à barres du vivant, qui a vu le jour en mai 2005 (www), a l’intention de coder à barres au moins 10 000 espèces animales canadiennes au cours des cinq prochaines années.

Nous considérons ces signes de synergie croissante entre les divers secteurs de la communauté de la biodiversité comme extrêmement prometteurs. Si elle est développée à son plein potentiel, l’histoire pourrait considérer l’entreprise de codage à barres de l’ADN comme celle qui a non seulement amélioré l’accès à l’information taxonomique, mais aussi renforcé les alliances entre tous ceux qui ont des intérêts dans la documentation, la compréhension et la préservation de la biodiversité – une perspective excitante en effet.

Remerciements

Nous remercions Mark Stoeckle et Dan Janzen pour leurs précieuses suggestions de révision des versions antérieures de cet article. Nous sommes également très reconnaissants à la Fondation Gordon et Betty Moore, au CRSNG, à la FCI et à l’OIT pour leur soutien à la recherche sur le codage à barres de l’ADN à l’Université de Guelph.

Alroy

Combien d’espèces nommées sont valides ? Proc

Natl Acad Sci. USA

2002

, vol.

(pg.

3706

–

3711

)

Ball

S. L.

Hebert

P. D. N.

Burian

S. K.

Webb

J. M.

Identifications biologiques des éphémères (Ephemeroptera) à l’aide de codes-barres ADN

JNABS

2005

, vol.

(pg.

508

–

524

)

Barrett

R. D. H.

Hebert

P. D. N.

Identification des araignées par les codes-barres ADN

Can J. Zool.

2005

, vol.

(pg.

481

–

491

)

Beskansky

N. J.

Severson

D. W.

Ferdig

M. T.

DNA barcoding of parasites and invertebrate disease vectors : What you don’t know can hurt you

Trends Parasit.

2003

, vol.

(pg.

545

–

546

)

Dunn

C. P.

Keeping taxonomy based in morphology

Trends Ecol. Evol.

2003

, vol.

(pg.

270

–

271

)

Ebach

M. C.

Holdrege

Le codage à barres de l’ADN ne remplace pas la taxonomie ?

Nature

2005

, vol.

434

pg.

697

Smith

M. A.

Fisher

B. L.

Hebert

P. D. N.

Le codage à barres de l’ADN pour une évaluation efficace de la biodiversité d’un groupe d’arthropodes hyperdivers : Les fourmis de Madagascar

Phil. Trans. R. Soc. Lond. B

2005

In press

Gaston

K. J.

O’Neill

M. A.

Identification automatisée des espèces : Pourquoi pas ?

Phil. Trans. R. Soc. Lond. B

2004

, vol.

359

(pg.

655

–

667

)

Godfray

H. C. J.

Challenges for taxonomy

Nature

2002

, vol.

417

(pg.

–

)

Hebert

P. D. N.

Barrett

R. D. H.

Reply to the comment by L. Prendini on « Identifying spiders through DNA barcodes »

Can. J. Zool.

2005

, vol.

(pg.

505

–

506

)

Hebert

P. D. N.

Cywinska

Ball

S. L.

deWaard

J. R.

Identifications biologiques par codes-barres ADN

Proc. R. Soc. Lond. B

2003

, vol.

270

(pg.

313

–

321

)

Hebert

P. D. N.

Penton

E. H.

Burns

J. M.

Janzen

D. H.

Hallwachs

Dix espèces en une : Le codage à barres de l’ADN révèle des espèces cryptiques chez le papillon hespérie néotropical Astrapes fulgerator

Proc. Natl. Acad. Sci. USA

2004

, vol.

101

(pg.

14812

–

14817

)

Hebert

P. D. N.

Stoeckle

M. Y.

Zemlak

T. S.

Francis

C. M.

Identification des oiseaux par codes-barres ADN

PLoS Biology

2004

, vol.

(pg.

1657

–

1663

)

Hogg

I. D.

Hebert

P. D. N.

Identifications biologiques des collemboles (Hexapoda : Collembola) de l’Arctique canadien à l’aide de codes-barres d’ADN mitochondrial

Can. J. Zool.

2004

, vol.

(pg.

749

–

754

)

Janzen

D. J.

Now is the time

Phil. Trans. R. Soc. Lond. B

2004

, vol.

359

(pg.

731

–

732

)

Janzen Hajibabaei

D. H. M.

Burns

J. M.

Hallwachs

Remigio

Hebert

P. D. N.

Inventaire de la biodiversité d’une grande et complexe faune de lépidoptères avec DNA barcoding

Phil. Trans. R. Soc. Lond. B

2005

In press

Kress

W. J.

Wurdack

K. J.

Zimmer

E. A.

Weigt

L. A.

Janzen

D. H.

Utilisation de codes-barres ADN pour identifier les plantes à fleurs

Proc. Natl. Acad. Sci USA

2005

, vol.

102

(pg.

8369

–

8374

)

Lipscomb

Platnick

Wheeler

Le contenu intellectuel de la taxonomie : Un commentaire sur la taxonomie de l’ADN

Trends Ecol. Evol.

2003

, vol.

(pg.

–

)

Mallet

Willmott

Taxonomie : Renaissance ou tour de Babel ?

Tendances Ecol. Evol.

2003

, vol.

(pg.

–

)

Marko

P. B.

Lee

S. C.

Rice

A. M.

Gramling

J. M.

Fitzhenry

T. M.

McAlister

J. S.

Horn

G. R.

Moran

A. L.

L’étiquetage d’un poisson ref appauvri

Nature

2004

, vol.

430

(pg.

309

–

310

)

Marshall

Les codes-barres ADN insuffleront-ils une nouvelle vie à la classification ?

Science

2005

, vol.

307

pg.

1037

Seberg

Humphries

C. J.

Knapp

Stevenson

D. W.

Petersen

Scharff

Andersen

N. M.

Shortcuts dans la systématique ? Un commentaire sur la taxonomie basée sur l’ADN

Trends Ecol. Evol.

2003

, vol.

(pg.

–

)

Smith

V. S.

DNA barcoding : Perspectives d’un débat « Partenariats pour l’amélioration de l’expertise en taxonomie » (PEET)

Syst. Biol.

2005

Ce numéro

Stoeckle

Taxonomie, ADN, et le code-barres de la vie

BioScience

2003

, vol.

(pg.

–

)

Wahlberg

Oliveira

Scott

J. A.

Relations phylogénétiques des espèces de papillons Phycoides (Lepidoptera : Nymphalidae) : Variation complexe de l’ADNmt et délimitation des espèces

Syst. Entomol.

2003

, vol.

(pg.

–

)

Ward

R. D.

Zemlak

T. S.

Innes

B. H.

Last

P. R.

Hébert

P. D. N.

Un début de codage à barres de l’ADN des espèces de poissons d’Australie

Phil. Trans. R. Soc. Lond. B

2005

In press

Wheeler

Q. D.

Triage taxonomique et la pauvreté de la phylogénie

Phil. Trans. R. Soc. Lond. B

2004

, vol.

359

(pg.

571

–

583

)

Will

K. W.

Mishler

B. D.

Wheeler

Q. D.

Les périls du codage à barres de l’ADN et la nécessité d’une taxonomie intégrative

Syst. Biol.

2005

Ce numéro

Will

K. W.

Rubinoff

Mythe de la molécule : Les codes-barres ADN des espèces ne peuvent remplacer la morphologie pour l’identification et la classification

Cladistics

2004

, vol.

(pg.

–

)

Universe

La promesse du codage à barres de l’ADN pour la taxonomie

Questions

Donné deux milliards de dollars US (le montant qu’un programme complet de codage à barres de l’ADN est estimé coûter ), comment dépenseriez-vous cet argent au profit de la recherche en taxonomie et en biodiversité, et quel serait l’héritage de ces données ?

A l’échelle mondiale, la recherche taxonomique alpha (la découverte et la description de nouvelles espèces) est en crise. Le codage à barres de l’ADN est-il une solution rapide à ce problème ou accélérera-t-il son déclin ?

Le chevauchement de la variation des caractères entre et au sein des espèces est bien documenté pour de nombreux systèmes de caractères. Pourquoi est-ce un problème plus ou moins important pour le codage à barres de l’ADN ?

Les gènes de codage-barres proposés peuvent échouer à récupérer des arbres d’espèces précis. Est-ce important pour le codage à barres de l’ADN ?

Certaines espèces ne sont pas mitochondrialement monophylétiques, partageant des polymorphismes avec des taxons non apparentés. Comment cela affectera-t-il les identifications utilisant une approche de codage à barres ?

L’expansion inévitable des efforts de séquençage qui viendrait avec un programme de codage à barres de l’ADN serait-elle concomitante avec une baisse de la qualité de la recherche taxonomique ?

En supposant que les problèmes techniques du codage à barres de l’ADN puissent être surmontés, est-il maintenant, ou sera-t-il jamais rentable par rapport aux méthodes traditionnelles d’utiliser les codes à barres de l’ADN à des fins de bioinventaire ?

Déclaration de position

Remerciements

Leave a Reply Cancel