HHpred

Vous pouvez aider EcoliWiki en modifiant le contenu de cette page. Pour savoir comment devenir un utilisateur enregistré et obtenir des privilèges d’édition, consultez Aide:Comptes.

<protéger>

Link/URL:

Hpred

Quoi:

Détecter les homologies à distance par comparaison de modèles de Markov cachés

Qui:

Dep. d’évolution des protéines à l’Institut Max-Planck de biologie du développement

edit table

</protect>

Short Description

Partagez vos connaissances et vos idées. Comment vous pouvez aider. Voir les pages d’aide si vous avez besoin d’aide pour utiliser le wiki

Page d’accueil

Hsearch est un programme pour la recherche de séquences de protéines qui est libre pour une utilisation non commerciale. HHpred est un serveur gratuit de prédiction de la fonction et de la structure des protéines basé sur la méthode HHsearch. HHpred/HHsearch sont parmi les méthodes les plus populaires pour la prédiction de la structure des protéines et la détection de séquences apparentées à distance, ayant été citées plus de 380 fois.

Les recherches de séquences sont fréquemment effectuées par les biologistes pour déduire la fonction d’une protéine inconnue à partir de sa séquence. Pour cela, la séquence de la protéine est comparée aux séquences d’autres protéines dans les bases de données publiques et sa fonction est déduite de celles des séquences les plus similaires. Souvent, aucune séquence avec des fonctions annotées ne peut être trouvée lors d’une telle recherche. Dans ce cas, des méthodes plus sensibles sont nécessaires pour identifier des protéines ou des familles de protéines plus éloignées les unes des autres. À partir de ces relations, des hypothèses sur les fonctions, la structure et la composition des domaines de la protéine peuvent être déduites. HHsearch effectue des recherches avec une séquence de protéines dans des bases de données. Le serveur HHpred et le progiciel HHsearch proposent de nombreuses bases de données populaires, régulièrement mises à jour, comme la Protein Data Bank, ainsi que les bases de données InterPro, Pfam, COG et SCOP.

Hpred/HHsearch appartient à la classe des outils de comparaison profil-profil, qui comprend les méthodes de recherche de séquence les plus sensibles à ce jour. Ils représentent à la fois la séquence d’interrogation et les séquences de la base de données par des profils de séquence, également appelés matrices de notation spécifiques à la position (PSSM). Les profils sont calculés à partir d’un alignement de séquences multiples de séquences apparentées qui sont généralement recueillies à l’aide du programme PSI-BLAST du National Center for Biotechnology Information (NCBI). Un profil est une matrice contenant pour chaque position dans la séquence d’interrogation le score de similarité pour les 20 acides aminés. Ces scores sont calculés à partir des fréquences des acides aminés aux positions correspondantes dans l’alignement de séquences multiples. Parce que les profils contiennent beaucoup plus d’informations qu’une seule séquence (par exemple, le degré de conservation spécifique à la position), les méthodes de comparaison profil-profil sont beaucoup plus puissantes que les méthodes de comparaison séquence-séquence comme BLAST ou les méthodes de comparaison profil-séquence comme PSI-BLAST.

Hpred/HHsearch représente les protéines de la requête et de la base de données par des modèles de Markov cachés (HMM) de profil, une extension des profils de séquence qui enregistrent également les fréquences d’insertion et de suppression d’acides aminés spécifiques à la position. HHsearch recherche une base de données de HMMs avec un HMM de requête. Avant de commencer la recherche dans la base de données actuelle des HMM, HHsearch/HHpred construit un alignement de séquences multiples de séquences apparentées en utilisant une version spécifique au contexte de PSI-BLAST, appelée CSI-BLAST. À partir de cet alignement, un HMM de profil est calculé. Les bases de données contiennent des HMM qui sont précalculés de la même manière en utilisant PSI-BLAST. Les résultats de HHpred et HHsearch sont une liste classée des correspondances entre les bases de données (y compris les valeurs E et les probabilités d’une relation vraie) et les alignements de séquences par paire entre la requête et la base de données. Une recherche dans la base de données PDB des protéines dont la structure 3D a été résolue prend quelques minutes. Si une correspondance significative avec une protéine de structure connue (un « modèle ») est trouvée dans la base de données PDB, HHpred permet de construire un modèle d’homologie à l’aide du logiciel MODELLER, en partant de l’alignement requête-modèle par paire.

Les applications de HHpred/HHsearch comprennent la prédiction de la structure des protéines, la prédiction des fonctions, la prédiction des domaines, la prédiction des limites des domaines et la classification évolutive des protéines. Dans l’expérience de benchmark CASP7, HHpred5 a été classé 2ème sur 68 serveurs de prédiction automatique de structure, tout en étant plus de 50 fois plus rapide que les 20 meilleurs serveurs.

Liens

http://toolkit.tuebingen.mpg.de/hhpred

http://toolkit.lmb.uni-muenchen.de/hhpred

Requirements

Serveur web

Notes d’utilisation

Site web CASP : http://predictioncenter.org/

Détection de l’homologie des protéines de la membrane externe : HHomp

Voir Help:References pour savoir comment gérer les références dans EcoliWiki.

  1. 1.0 1.1 Söding, J (2005) Détection de l’homologie des protéines par comparaison HMM-HMM. Bioinformatics 21 951-60 PubMed
  2. Söding, J et al. (2005) The HHpred interactive server for protein homology detection and structure prediction. Nucleic Acids Res. 33 W244-8 PubMed
  3. 3.0 3.1 Jaroszewski, L et al. (2000) Improving the quality of twilight-zone alignments. Protein Sci. 9 1487-96 PubMed
  4. Sadreyev, RI et al. (2003) Profile-profile comparisons by COMPASS predict intricate homologies between protein families. Protein Sci. 12 2262-72 PubMed
  5. Dunbrack, RL Jr (2006) Sequence comparison and protein structure prediction. Curr. Opin. Struct. Biol. 16 374-84 PubMed
  6. Battey, JN et al. (2007) Automated server predictions in CASP7. Proteins 69 Suppl 8 68-82 PubMed

Leave a Reply