CAZy-tietokanta/hiilihydraattiaktiivisten entsyymien (CAZy) tietokanta: Principles and Usage Guidelines

Abstract

Carbohydrate-Active enZymes (CAZymes) kokoavat, hajottavat ja muokkaavat glykaaneja ja glykokonjugaatteja käyttämällä katalyyttisiä ja sitovia moduulejaan (funktionaalisia proteiinidomeeneja). CAZy-tietokanta tarjoaa vuodesta 1998 lähtien verkossa olevan ja jatkuvasti päivitettävän CAZyymimoduulien luokittelun (Lombard et al. 2014). CAZy-luokituksen kukin moduuliperhe on luotu kirjallisuudesta löytyvien kokeellisesti karakterisoitujen proteiinimoduulien perusteella, ja perheet on täytetty julkisista proteiinisekvenssitietokannoista löytyvillä, toisiinsa liittyvillä moduulisekvensseillä. Koska mikään universaali kynnysarvo ei mahdollista eri CAZyme-perheiden systemaattista luokittelua, CAZy-annotaatiot ovat tulosta moduulien mallintamisen/kalibroinnin ja inhimillisen kuratoinnin asiantuntijayhdistelmästä. CAZy-annotaatiot ovat julkisesti saatavilla kaikkien GenBankin (Benson et al. 2012), Swiss-Protin (Boutet et al. 2016) ja Protein Data Bankin (PDB; http://www.rcsb.org; (Berman et al. 2000)) julkaisemien proteiinien osalta. Lisäksi kirjallisuudesta säännöllisesti kuratoidut toiminnalliset ja kolmiulotteiset rakennetiedot muodostavat olennaisia lisäarvoja CAZy-annotaatioon. Tässä hengessä on hiljattain kehitetty liganditietojen näyttämistä kiteellisistä komplekseista (Lombard et al. 2014). Tässä luvussa opastetaan lukijaa CAZy:n käyttöön entsyymien annotaatioiden etsimisessä. Siinä vastataan myös usein esiintyviin kysymyksiin, kuten i) miten saada CAZy-annotaatioita tietylle proteiinille, genomille tai metagenomille, ii) miten saada hiljattain karakterisoitu perhe sisällytettyä CAZy-luokitusjärjestelmään, iii) miksi CAZy ei kata kaikkia glykaaneihin/glykonjugaatteihin liittyviä proteiiniperheitä ja iv) miksi CAZy ei siirrä funktionaalista annotaatiota samankaltaisiin sekvensseihin. Lopuksi esittelemme tässä tuoreen CAZyyn liittyvän työkalun, nimittäin Bacteroidetes-lajien polysakkaridien hyödyntämislokien (Polysaccharide Utilization Loci, PUL) ennustajan ja tietokannan (Terrapon et al. 2015).

Leave a Reply