La base de données CAZy/the Carbohydrate-Active Enzyme (CAZy) : Principes et directives d’utilisation

Abstract

Les enZymes à activité glucidique (CAZymes) assemblent, décomposent et modifient les glycanes et les glycoconjugués en utilisant leurs modules catalytiques et de liaison (domaines protéiques fonctionnels). La base de données CAZy offre depuis 1998 une classification en ligne et continuellement mise à jour des modules CAZymes (Lombard et al. 2014). Chaque famille de modules de la classification CAZy a été créée à partir de modules protéiques caractérisés expérimentalement dans la littérature, et les familles sont peuplées de séquences de modules apparentés provenant de bases de données publiques de séquences protéiques. Comme aucun seuil universel ne permet la classification systématique des différentes familles CAZy, les annotations CAZy résultent d’une combinaison experte de modélisation/calibrage de modules et de curation humaine. Les annotations CAZy sont rendues publiques pour toutes les protéines publiées par GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016) et la Protein Data Bank (PDB ; http://www.rcsb.org ; (Berman et al. 2000)). De plus, les informations fonctionnelles et structurelles 3-D, curatées régulièrement à partir de la littérature, constituent des valeurs ajoutées essentielles à l’annotation CAZy. Dans cet esprit, l’affichage d’informations sur les ligands à partir de complexes cristallographiques a été récemment développé (Lombard et al. 2014). Ce chapitre guidera le lecteur dans l’utilisation de CAZy pour rechercher des annotations d’enzymes. Il répondra également aux questions fréquentes telles que (i) comment obtenir des annotations CAZy pour une protéine spécifique, un génome ou un métagénome, (ii) comment faire inclure une famille nouvellement caractérisée dans le schéma de classification CAZy, (iii) pourquoi CAZy ne couvre pas toutes les familles de protéines liées aux glycanes/glycoconjugués, et (iv) pourquoi CAZy ne transfère pas l’annotation fonctionnelle à des séquences similaires. Enfin, nous présentons ici un outil récent associé à CAZy, à savoir le prédicteur et la base de données Polysaccharide Utilization Loci (PUL) chez les espèces Bacteroidetes (Terrapon et al. 2015).

Leave a Reply