La base de datos CAZy/la base de datos de enzimas activas en carbohidratos (CAZy): Principios y directrices de uso

Abstract

Las enzimas activas en carbohidratos (CAZymes) ensamblan, descomponen y modifican glicanos y glucoconjugados utilizando sus módulos catalíticos y de unión (dominios proteicos funcionales). La base de datos CAZy ofrece desde 1998 una clasificación en línea y continuamente actualizada de los módulos CAZyme (Lombard et al. 2014). Cada familia de módulos de la clasificación CAZy se ha creado a partir de módulos proteicos caracterizados experimentalmente en la bibliografía, y las familias están pobladas por secuencias de módulos relacionados procedentes de bases de datos públicas de secuencias de proteínas. Dado que no existe un umbral universal que permita la clasificación sistemática de las distintas familias de CAZy, las anotaciones de CAZy son el resultado de una combinación experta de modelado/calibración de módulos y curación humana. Las anotaciones de CAZy están disponibles públicamente para todas las proteínas publicadas por GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016) y el Banco de Datos de Proteínas (PDB; http://www.rcsb.org; (Berman et al. 2000)). Además, la información funcional y estructural tridimensional, curada desde la literatura de forma regular, constituye valores añadidos esenciales para la anotación de CAZy. Con este espíritu, se ha desarrollado recientemente la visualización de información sobre ligandos a partir de complejos cristalográficos (Lombard et al. 2014). Este capítulo guiará al lector en el uso de CAZy para buscar anotaciones de enzimas. También responderá a preguntas frecuentes como (i) cómo obtener anotaciones de CAZy para una proteína específica, un genoma o un metagenoma, (ii) cómo hacer que una familia recién caracterizada se incluya en el esquema de clasificación de CAZy, (iii) por qué CAZy no cubre todas las familias de proteínas relacionadas con glicanos/glicoconjugados, y (iv) por qué CAZy no transfiere la anotación funcional a secuencias similares. Por último, presentamos aquí una herramienta reciente asociada a CAZy, a saber, el predictor y la base de datos Polysaccharide Utilization Loci (PUL) en especies de Bacteroidetes (Terrapon et al. 2015).

Leave a Reply