CAZyデータベース/糖質活性酵素(CAZy)データベース: 原則と利用ガイドライン

Abstract

Carbohydrate-Active enZymes (CAZymes) は触媒および結合モジュール(機能タンパク質ドメイン)を用いて糖鎖および糖鎖複合体の組み立て、分解、修飾を行う。 CAZyデータベースは、1998年以来、CAZymeモジュールの分類をオンラインで継続的に更新しています(Lombard et al.2014)。 CAZy分類の各モジュールファミリーは、文献から実験的に特徴づけられたタンパク質モジュールに基づいて作成されており、ファミリーには公開タンパク質配列データベースから関連するモジュール配列が入力されています。 CAZyのアノテーションは、モジュールモデリング/キャリブレーションと人によるキュレーションを組み合わせたもので、普遍的な閾値がないため、様々なCAZyファミリーを体系的に分類することが可能です。 CAZyアノテーションは、GenBank (Benson et al. 2012), Swiss-Prot (Boutet et al. 2016), Protein Data Bank (PDB; http://www.rcsb.org; (Berman et al. 2000)) で公開されている全てのタンパク質について公開されています。 さらに、定期的に文献からキュレートされる機能情報や3次元構造情報は、CAZyアノテーションに不可欠な付加価値となります。 この精神に基づき、結晶学的複合体からのリガンド情報の表示が最近開発された(Lombard et al.2014)。 本章では、酵素アノテーションを検索するためのCAZyの使い方を解説します。 また、(i)特定のタンパク質、ゲノム、メタゲノムに対するCAZyアノテーションの入手方法、(ii)新しく特徴付けられたファミリーをCAZy分類スキームに含める方法、(iii)なぜCAZyは糖鎖/糖鎖関連タンパク質ファミリーすべてをカバーしていないのか、(iv)なぜCAZyは類似配列に機能アノテーションを移さないのかといったよくある質問について答える予定である。 最後に,最近のCAZy関連ツールであるバクテロイデテス種のPUL(Polysaccharide Utilization Loci)予測・データベース(Terrapon et al.2015)を紹介する

Leave a Reply