Baza danych CAZy/ The Carbohydrate-Active Enzyme (CAZy) Database: Principles and Usage Guidelines

Abstract

Carbohydrate-Active enZymes (CAZymes) montują, rozkładają i modyfikują glikany i glikokoniugaty za pomocą swoich modułów katalitycznych i wiążących (funkcjonalnych domen białkowych). Baza danych CAZy oferuje od 1998 roku internetową i stale aktualizowaną klasyfikację modułów CAZyme (Lombard et al. 2014). Każda rodzina modułów w klasyfikacji CAZy została stworzona w oparciu o eksperymentalnie scharakteryzowane moduły białkowe z literatury, a rodziny są zaludniane przez powiązane sekwencje modułów z publicznych baz sekwencji białkowych. Ponieważ żaden uniwersalny próg nie pozwala na systematyczną klasyfikację różnych rodzin CAZy, adnotacje CAZy są wynikiem eksperckiego połączenia modelowania/kalibracji modułów i ludzkiej kurateli. Adnotacje CAZy są udostępniane publicznie dla wszystkich białek uwolnionych przez GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016) oraz Protein Data Bank (PDB; http://www.rcsb.org; (Berman et al. 2000)). Ponadto, informacje funkcjonalne i strukturalne 3-D, kuratorowane na bieżąco z literatury, stanowią istotne wartości dodane do anotacji CAZy. W tym duchu, wyświetlanie informacji o ligandach z kompleksów krystalograficznych zostało niedawno rozwinięte (Lombard et al. 2014). Niniejszy rozdział poprowadzi czytelnika przez wykorzystanie CAZy do przeszukiwania anotacji enzymatycznych. Odpowiemy również na częste pytania, takie jak (i) jak uzyskać adnotacje CAZy dla konkretnego białka, genomu lub metagenomu, (ii) jak włączyć nowo scharakteryzowaną rodzinę do schematu klasyfikacji CAZy, (iii) dlaczego CAZy nie obejmuje wszystkich rodzin białek związanych z glikanami/glikokoniugatami oraz (iv) dlaczego CAZy nie przenosi adnotacji funkcjonalnych na podobne sekwencje. Wreszcie, przedstawiamy tutaj najnowsze narzędzie związane z CAZy, a mianowicie, Polysaccharide Utilization Loci (PUL) predictor and database in Bacteroidetes species (Terrapon et al. 2015).

.

Leave a Reply