Die CAZy-Datenbank/die Datenbank für kohlenhydrataktive Enzyme (CAZy): Principles and Usage Guidelines

Abstract

Carbohydrate-Active enZymes (CAZyme) bauen Glykane und Glykokonjugate mit Hilfe ihrer katalytischen und bindenden Module (funktionelle Proteindomänen) auf, ab und modifizieren sie. Die CAZy-Datenbank bietet seit 1998 eine online verfügbare und ständig aktualisierte Klassifizierung der CAZyme-Module (Lombard et al. 2014). Jede Modulfamilie in der CAZy-Klassifikation wurde auf der Grundlage von experimentell charakterisierten Proteinmodulen aus der Literatur erstellt, und die Familien werden durch verwandte Modulsequenzen aus öffentlichen Proteinsequenzdatenbanken aufgefüllt. Da es keinen universellen Schwellenwert für die systematische Klassifizierung der verschiedenen CAZyme-Familien gibt, sind die CAZy-Annotationen das Ergebnis einer Kombination aus Modulmodellierung/Kalibrierung und menschlicher Kuration. CAZy-Annotationen werden für alle von GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016) und der Protein Data Bank (PDB; http://www.rcsb.org; (Berman et al. 2000)) veröffentlichten Proteine öffentlich zugänglich gemacht. Darüber hinaus stellen funktionale und 3-D-Strukturinformationen, die regelmäßig aus der Literatur kuratiert werden, einen wesentlichen Mehrwert für die CAZy-Annotation dar. In diesem Sinne wurde kürzlich die Anzeige von Ligandeninformationen aus kristallographischen Komplexen entwickelt (Lombard et al. 2014). Dieses Kapitel führt den Leser durch die Verwendung von CAZy zur Suche von Enzymannotationen. Außerdem werden häufige Fragen beantwortet, z. B. (i) wie man CAZy-Annotationen für ein bestimmtes Protein, ein Genom oder ein Metagenom erhält, (ii) wie man eine neu charakterisierte Familie in das CAZy-Klassifizierungsschema aufnimmt, (iii) warum CAZy nicht alle Proteinfamilien abdeckt, die mit Glykanen/Glykokonjugaten in Verbindung stehen, und (iv) warum CAZy keine funktionellen Annotationen auf ähnliche Sequenzen überträgt. Schließlich stellen wir hier ein neues CAZy-assoziiertes Werkzeug vor, nämlich den Polysaccharid Utilization Loci (PUL) Prädiktor und die Datenbank für Bacteroidetes-Arten (Terrapon et al. 2015).

Leave a Reply