HHHpred
Du kan hjælpe EcoliWiki ved at redigere indholdet på denne side. For oplysninger om at blive en registreret bruger og få redigeringsrettigheder, se Hjælp:Konti.
<protect>
HHHpred
Detektere fjerne homologier ved sammenligning af skjulte Markov-modeller
Dep. of Protein Evolution at the Max-Planck Institute for Developmental Biology
edit table
</protect>
Kort beskrivelse
Del din viden og dine idéer. Hvordan du kan hjælpe. Se Hjælpesiderne, hvis du har brug for hjælp til at bruge wiki
HHHsearch er et program til søgning efter proteinsekvenser, som er gratis til ikke-kommerciel brug. HHpred er en gratis server til forudsigelse af proteinfunktioner og proteinstrukturer, der er baseret på HHsearch-metoden. HHpred/HHsearch er blandt de mest populære metoder til forudsigelse af proteinstruktur og påvisning af fjernt beslægtede sekvenser og er blevet citeret over 380 gange.
Biologer udfører ofte sekvenssøgninger for at udlede funktionen af et ukendt protein ud fra dets sekvens. Til dette formål sammenlignes proteinets sekvens med sekvenser af andre proteiner i offentlige databaser, og dets funktion udledes af de sekvenser, der ligner hinanden mest. Ofte kan der ikke findes sekvenser med annoterede funktioner ved en sådan søgning. I dette tilfælde er der behov for mere følsomme metoder til at identificere mere fjernt beslægtede proteiner eller proteinfamilier. Ud fra disse relationer kan man udlede hypoteser om proteinets funktioner, struktur og domænesammensætning. HHsearch udfører søgninger med en proteinsekvens gennem databaser. HHpred-serveren og HHsearch-softwarepakken tilbyder mange populære, regelmæssigt opdaterede databaser, f.eks. Protein Data Bank samt InterPro-, Pfam-, COG- og SCOP-databaserne.
HHHpred/HHsearch tilhører klassen af profil-profil sammenligningsværktøjer, som omfatter de mest følsomme sekvenssøgningsmetoder til dato. De repræsenterer både forespørgselssekvensen og databasens sekvenser ved hjælp af sekvensprofiler, også kaldet positionsspecifikke scoringsmatricer (PSSM’er). Profilerne beregnes ud fra en multipel sekvenstilpasning af beslægtede sekvenser, som typisk indsamles ved hjælp af PSI-BLAST-programmet fra National Center for Biotechnology Information (NCBI). En profil er en matrix, der for hver position i forespørgselssekvensen indeholder lighedsscoren for de 20 aminosyrer. Disse scorer beregnes ud fra hyppigheden af aminosyrerne på de tilsvarende positioner i den multiple sekvenstilpasning. Da profiler indeholder langt flere oplysninger end en enkelt sekvens (f.eks. den positionsspecifikke bevaringsgrad), er profil-profil sammenligningsmetoder langt mere effektive end sekvens-sekvens sammenligningsmetoder som BLAST eller profil-sekvens sammenligningsmetoder som PSI-BLAST.
HHHpred/HHsearch repræsenterer forespørgsels- og databaseproteiner ved hjælp af profil skjulte Markov-modeller (HMM’er), en udvidelse af sekvensprofiler, som også registrerer positionsspecifikke aminosyreindsættelses- og -deletionshyppigheder. HHsearch søger i en database af HMM’er med en forespørgsels-HMM. Inden søgningen i den egentlige database af HMM’er påbegyndes, opbygger HHsearch/HHpred en multipel sekvensalignering af beslægtede sekvenser ved hjælp af en kontekstspecifik version af PSI-BLAST, kaldet CSI-BLAST. Ud fra denne tilpasning beregnes en profil-HMM. Databaserne indeholder HMM’er, der er forudberegnet på samme måde ved hjælp af PSI-BLAST. Resultatet af HHpred og HHsearch er en rangordnet liste over databaseoverensstemmelser (herunder E-værdier og sandsynligheder for et sandt forhold) og de parvise sekvenstilpasninger mellem forespørgselsdatabasen og databasen. En søgning i PDB-databasen over proteiner med løst 3D-struktur tager et par minutter. Hvis der findes et signifikant match med et protein med kendt struktur (en “skabelon”) i PDB-databasen, giver HHpred mulighed for at opbygge en homologimodel ved hjælp af MODELLER-softwaren, der tager udgangspunkt i den parvise forespørgsels-skabelon-lignment.
Anvendelserne af HHpred/HHsearch omfatter forudsigelse af proteinstruktur, funktionsforudsigelse, domæneforudsigelse, forudsigelse af domænegrænser og evolutionær klassifikation af proteiner. I CASP7-benchmarkforsøget blev HHpred5 placeret på andenpladsen ud af 68 automatiske strukturprædiktionsservere og var samtidig mere end 50 gange hurtigere end de 20 bedste servere.
Links
http://toolkit.tuebingen.mpg.de/hhpred
http://toolkit.lmb.uni-muenchen.de/hhpred
Krav
Webserver
Brugernoter
CASP-websted: http://predictioncenter.org/
Homologidetektion af proteiner fra ydre membraner: HHomp
Se Hjælp:Referencer for hvordan man håndterer referencer i EcoliWiki.
- 1.0 1.1 Söding, J (2005) Protein homology detection by HMM-HMM comparison. Bioinformatics 21 951-60 PubMed
- Söding, J et al. (2005) The HHpred interactive server for protein homology detection and structure prediction (HHpred interaktiv server for protein homology detection and structure prediction). Nucleic Acids Res. 33 W244-8 PubMed
- 3.0 3.1 Jaroszewski, L et al. (2000) Improving the quality of twilight-zone alignments. Protein Sci. 9 1487-96 PubMed
- Sadreyev, RI et al. (2003) Profile-profile-sammenligninger ved hjælp af COMPASS forudsiger indviklede homologier mellem proteinfamilier. Protein Sci. 12 2262-72 PubMed
- Dunbrack, RL Jr (2006) Sequence comparison and protein structure prediction. Curr. Opin. Struct. Biol. 16 374-84 PubMed
- Battey, JN et al. (2007) Automatiserede serverprædiktioner i CASP7. Proteins 69 Suppl 8 68-82 PubMed
Leave a Reply