CAZy-databasen/ databasen över kolhydrataktiva enzymer (CAZy): Principles and Usage Guidelines
Abstract
Carbohydrate-Active enZymes (CAZymes) monterar, bryter ner och modifierar glykaner och glykokonjugater med hjälp av sina katalytiska och bindande moduler (funktionella proteindomäner). CAZy-databasen erbjuder sedan 1998 en online och kontinuerligt uppdaterad klassificering av CAZyme-moduler (Lombard et al. 2014). Varje modulfamilj i CAZy-klassificeringen har skapats utifrån experimentellt karakteriserade proteinmoduler från litteraturen, och familjerna fylls med relaterade modulsekvenser från offentliga proteinsekvensdatabaser. Eftersom ingen universell tröskel gör det möjligt att systematiskt klassificera de olika CAZyme-familjerna är CAZy-annotationerna resultatet av en expertkombination av modulmodellering/kalibrering och mänsklig kuratering. CAZy-annotationer görs offentligt tillgängliga för alla proteiner som släpps av GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016) och Protein Data Bank (PDB; http://www.rcsb.org; (Berman et al. 2000)). Vidare utgör funktionell och 3D-strukturell information, som regelbundet kureras från litteraturen, viktiga mervärden för CAZy-annotationen. I denna anda har visning av ligandinformation från kristallografiska komplex nyligen utvecklats (Lombard et al. 2014). Det här kapitlet kommer att vägleda läsaren genom användningen av CAZy för att söka i enzymannotationer. Det kommer också att besvara frekventa frågor som i) hur man får CAZy-annotationer för ett specifikt protein, ett genom eller ett metagenom, ii) hur man får en nykarakteriserad familj inkluderad i CAZy-klassificeringsschemat, iii) varför CAZy inte täcker alla proteinfamiljer som är relaterade till glykaner/glykokonjugater, och iv) varför CAZy inte överför funktionell annotering till liknande sekvenser. Slutligen presenterar vi här ett nytt CAZy-associerat verktyg, nämligen Polysaccharide Utilization Loci (PUL) predictor and database in Bacteroidetes species (Terrapon et al. 2015).
Leave a Reply