Draft genome of the European medicinal leech Hirudo medicinalis (Annelida, Clitellata, Hirudiniformes), különös tekintettel a véralvadásgátlókra
Összeszerelési statisztika és BUSCO-elemzés
A Hirudo medicinalis ROMIZI 11733 genomtervezetét 19 929 scaffolddal szerelték össze, amelyek 176.96 Mbps, 146,78×-os medián lefedettséggel, 50 382 bps N50 pontszámmal és 772 L50 pontszámmal (a genomtervezet teljes statisztikája az 1. kiegészítő fájlban található). BUSCO ver. 4.0.526 futtatásával értékeltük a genom teljességét. A prediktált fehérjék vs. metazoa_odb10 elemzése 94,2%-os teljességi pontszámot eredményezett (90,0% teljes + 4,2% fragmentált).
Az összeállítás mérete a becsült genom méretének (230 Mbps; http://genomesize.com) 78,67%-át teszi ki. A MAKER27 segítségével végzett kétmenetes annotáció 35 166 prediktált fehérjét eredményezett 780 splice-változattal. A tRNAscan-SE28 segítségével összesen 429 tRNS-gént, valamint további 116 pszeudogént jósoltak. Az Infernal29 segítségével további 535 nem-kódoló RNS-gént/motívumot jósoltak, amelyek között 64 rRNS-gén és 316 mikroRNS szerepelt. A genom repetitív tartalmát a RepeatModeler30 segítségével 24,71%-ra becsülték (14,43% interspersed és 10,28% egyszerű ismétlődések), a leggyakoribb egység az osztályozatlan (6,14%) volt. Az összes annotációs fájl a https://doi.org/10.5281/zenodo.3555585 címen került letétbe (utolsó hozzáférés: 2020. január 20.). A nyers leolvasásokat, valamint az összeállított szekvenciákat az Európai Nukleotid Archívumban (ENA) helyeztük letétbe a PRJEB35865 tanulmányhozzáférés alatt.
Léh antikoagulánsok, kópiaszám és tandem ismétlődések
A Hirudo medicinalis genomjában összesen olyan géntermékeket találtunk, amelyek megfelelő BLASTp találatot (1E-5-nél jobb) mutattak 18 jól jellemzett piócából származó, a vérzéscsillapítással kapcsolatos funkciójú fehérjével szemben (1. táblázat). Ezek közé tartozik az eglin C, a destabiláz I, a ghilanten, a piócából származó triptáz inhibitor (LDTI), a guamerin, a cisztatin, a hirudin, a hirudinszerű faktor 3, a ficolin, a Kazal-típusú szerinproteáz-inhibitorok (szerpinek), a C-típusú lektin, a manilláz, a bdellin, a piguamerin, az antistasin, a bdellastasin, a lefaxin és egy azonosítatlan trombininhibitor. Az 1. táblázat a H. medicinalis genomból származó top találatokat mutatja, a három globális adatbázissal szembeni találatokkal, a gén kópiaszámával a genomban, valamint a jelzőpeptid jelenlétével vagy hiányával együtt.
A 18 feltételezett véralvadásgátló fehérje közül hét egyetlen példányban fordul elő adatainkban (1. táblázat); megjegyzendő, hogy még mindig fennáll az esélye annak, hogy a genom szekvenálatlan részein több példány is jelen van. Ezek a piguamerin, a hirudin, a ghilanten, a hirudinszerű 3. faktor, az LDTI, az azonosítatlan trombininhibitor és a cisztatin. A legmagasabb kópiaszámot (n = 7) az eglin C és a destabiláz esetében találtuk; míg az előbbi esetében a kópiák szétszóródni látszottak az állványzaton (a hét kópia hat különböző állványzaton fordult elő), az utóbbi esetében három kópia volt ugyanazon az állványzaton és egy másik állványzaton két kópia.
Míg a legtöbb itt célba vett antikoaguláns nem egymás mellett helyezkedik el a genomtervezetünkben, a következő fehérjék két vagy több példányban, tandem-mátrixokban látszanak előfordulni: C-típusú lektin (az exon- és intronméretek erős konzerválásával a kópiák között), guamerin (az exon- és intronméretek csak alacsony konzerválásával a kópiák között), Kazal-típusú szerinproteáz-inhibitor (az exon- és intronméretek csak alacsony konzerválásával a kópiák között) és bdellin (az exonméretek viszonylag konzerváltak, de az intronméretek különböznek a kópiák között). Továbbá, az LDTI és a bdellin teljesen három tandem kópiája szomszédos egymással a 209471 állványzaton.
Más bioaktív peptidek
Az ismert, piócából származó véralvadásgátló faktorok elleni találatokon kívül teljesen 1176 találatot találtak 227 különböző, vérrel táplálkozó szervezetekből izolált bioaktív vegyület ellen a H. medicinalis genomjából; ezek többségének funkciója és útvonalai továbbra is ismeretlenek, ezért csak azokra a nem piócás bioaktív fehérjékre összpontosítunk, amelyekről kimutatták, hogy részt vesznek az antikoagulációban. 23 különböző, a véralvadási kaszkádot negatívan befolyásoló fehérjével szemben találtunk robusztus találatokat (1E-5-nél jobb). Ezek közé tartozik a tromboszpondin-motívummal rendelkező dezintegrin és metalloproteináz (ADAMTS), apiráz, Kunitz-típusú szerinproteáz-inhibitor, fibrinogenáz, krizoptin, bothrojaracin, nitrogén-oxid (értágító), agglucetin, snaclec, hemorrhagiás metalloproteináz kaouthiagin, batroxstatin, trombin inhibitor (a Lone Star kullancsból, Amblyomma americanum), annexin, tabserin, trombin inhibitor protein (Rhodnius prolixusból), kígyóméreg szerin proteáz, kimotripszin, brasilienzin, kathepszin B, dipetalogastin, acheláz, halyxin és antitrombin-III (a királykobrából, Ophiophagus hannah). A 2. kiegészítő fájl az e peptidekre vonatkozó találatokat mutatja be, a kölcsönös BLAST-találatokkal és a szignálpeptid-előrejelzéssel együtt. A reciprok BLAST-találatok közül több a Helobdella robusta genomban található, nem kanotált (azaz “hipotetikus fehérje” vagy “nem jellemzett fehérje”) génekkel szemben adódott, így az egyezések azonosságára vonatkozóan kevés információt lehet levonni. Ugyanakkor a három globális adatbázisban található, jól annotált génekkel szemben is értékeltünk gyengébb (de még mindig 1E-5-nél jobb) találatokat. Az összes rendelkezésre álló információ kiértékelése után csak a következő fehérjetermékekről nem lehetett robusztusan következtetni arra, hogy jelen vannak a H. medicinalis genomban (pl, a többi fehérjetermék mind jelen van): krizoptin, nitrogén-oxid, trombin-inhibitor (az Amblyomma americanumból), kimotripszin, dipelogasztin és acheláz.
Sorrendi hasonlóság és páronkénti illesztések
A H. medicinalisból származó, véralvadásgátlással kapcsolatos fehérjék mindegyike. medicinalisból származó fehérjéket összehangoltuk az archetipikus megfelelőjükkel, és az összehangolásokat az 1. ábra (a destabiláz I, az LDTI, a hirudin és a hirudinszerű faktor 3, valamint a bdellin esetében) és a 3. kiegészítő fájl (az eglin C, a ghilanten, a guamerin, a cisztatin, a ficolin, a Kazal-típusú szerpin, a C-típusú lektin, a manilláz, a piguamerin, az antistasin, a bdellastasin és az azonosítatlan trombininhibitor esetében) mutatja be. Megjegyzendő, hogy a lefaxinnal szemben talált H. medicinalis szekvencia a hemeritrinnel szemben sokkal jobb találatot talált a kölcsönös BLAST-ellenőrzés során, és a továbbiakban nem tekintettük a lefaxin ortológjának.
A destabiláz I esetében az újonnan származtatott szekvencia 78%-os hasonlóságot mutat a közös aminosavakat tartalmazó pozíciókban (azaz, ha a hiányokat nem számoljuk) az ismert antikoagulánssal (GenBank accession number AAA9614431), amely eredetileg szintén a Hirudo medicinalisból származik. Ezenkívül mind a 14 ciszteinmaradvány pozíciója teljes konzerváltságot mutat, ami a fehérjék közötti hasonló hajtásszerkezetre utal. Az illesztés során nem találtunk indeleket (1A. ábra).
Az LDTI aminosav-illesztésében, beleértve az új szekvenciát és a Hirudo medicinalisból származó archetipikus szekvenciát (GenBank hozzáférési szám: AAB3376932), a két szekvencia 99%-os szekvencia-hasonlóságot és a hat cisztein-maradék pozíciójának teljes konzerváltságát mutatja. Indeleket nem találtunk (1B ábra).
Az újonnan szekvenált hirudin ortológ csaknem teljes konzerváltságot mutat (szekvencia hasonlóság 99,9%) az eredetileg a Hirudo verbanából származó archetipikus szekvenciával (GenBank accession number APA2083333) összehasonlítva. Ezenkívül az érett peptidben található hat cisztein maradék helyzete teljesen konzervált (két cisztein a szignálpeptid régióban is konzerválódott). Az összehangolásban nem voltak indel-események (1C. ábra).
A H. medicinalis genomból kinyert bdellin szekvencia 99,2%-os szekvencia-hasonlóságot mutat az eredetileg a H. medicinalisból származó archetipikus szekvenciával (GenBank accession number P0986534), és az összes cisztein-maradék (n = 6) pozíciója teljesen konzervált. Az összehangolásban nem voltak indelek (1D ábra).
Az eglin C esetében az új szekvencia 99,9%-os szekvencia-hasonlóságot mutat az archetipikus szekvenciával (GenBank hozzáférési szám: 0905140 A35) összehasonlítva. Egyik szekvenciában sincs ciszteinmaradék, és nem volt jelen indel (Supplementary File 3A).
A ghilanten újonnan szerzett szekvenciája csak 32%-os szekvencia-hasonlóságot mutat a Haementeria ghilianii (de Filippi, 1849) glossiphoniid piócából származó archetipikus szekvenciával (GenBank accession number AAB2123336) összehasonlítva. A szekvenciák közötti alacsony rokonság arra utal, hogy ezek nem ortológ szekvenciák. Ettől függetlenül az új szekvencia 25 ciszteinmaradványt tartalmaz az érett fehérjében, és ezek közül 17 helyzete konzerválódik az illesztésben. Mindkét szekvenciában jelen voltak az indel-események, amelyek közül a legnagyobb 25 maradékot fed le (inserció az új szekvenciában vagy deléció az archetipikus szekvenciában), és csak rövid (maximum n = 3) homopolimereket azonosítottak (Supplementary File 3B).
A guamerin esetében az új szekvencia 67%-os szekvencia-hasonlóságot mutat az archetipikus fehérjével (GenBank accession number AAD0944237), amely eredetileg a Hirudo nipponia Whitman, 1886-ból származik. Az összehangolásban szereplő mind a kilenc ciszteinmaradék helyzete teljesen konzervált. Nem találkoztunk indel-eseményekkel (Supplementary File 3C).
A cystatin új szekvenciája 57%-os hasonlóságot mutat a Theromyzon tessulatum (Müller, 1774) glossiphoniidából származó archetípusos megfelelőjével (GenBank accession number AAN2867938) összehasonlítva; az egyetlen ciszteinmaradék pozíciója konzerválódott a szekvenciák között. Az összehangolásban nem volt indel esemény (Supplementary File 3D).
A ficolin esetében a szekvencia hasonlóság 59% a közös aminosavpozíciók között az új szekvenciánk és az archetipikus szekvencia között (a Min et al.15 által használt adathalmazból), amely az észak-amerikai Macrobdella decora (Say, 1824) gyógypiócából származik. A M. decorából származó szekvenciában található három ciszteinmaradvány közül kettő ugyanabban a pozícióban van jelen az új szekvenciában is. Az új szekvenciában egy meglehetősen kiterjedt inszerció van jelen (vagy alternatívaként egy deléciós esemény az archetipikus szekvenciában), amely 27 aminosavmaradványt fed le (Supplementary File 3E).
Az újonnan származtatott Kazal-típusú szerpin csak 26%-os szekvencia-hasonlóságot mutat a közös aminosavhelyek tekintetében a Macrobdella decora-ból származó szekvenciával összehasonlítva (a Min et al.15 által használt adathalmazból). Az “archetipikus” szekvenciában található 13 ciszteinmaradványból 12 konzervált pozíciót mutat az új szekvenciában. Rövid indelek mindkét szekvenciában jelen vannak (Supplementary File 3F).
A C-típusú lektin összehangolása azt mutatja, hogy 43%-os szekvencia-hasonlóság van az új szekvencia és a M. decorából származó archetipikus összehasonlítás között (lásd15). Az archetipikus szekvenciában tizenhárom cisztein-maradék található, és ezek közül kilencnek a pozíciója konzervált az újonnan szerzett szekvenciában. Három elszigetelt, rövid deléció található az archetipikus szekvenciában (vagy alternatívaként ezek az új szekvenciában történő beillesztéseket jelentenek) (Kiegészítő fájl 3G).
A manilláz esetében a közös aminosavmaradványok 83%-a megegyezik az új szekvencia és az amerikai szabadalmi bejelentésből (2006 US 7.049.124 B1P09856) származó, a Hirudinaria manillensis Lesson, 1842 ázsiai orvosi piócából kinyert szekvencia között. Mint ismeretes, a manilláz teljesen mentes a ciszteinmaradványoktól, így a Hirudo medicinalisból származó szekvencia is. Az illesztés közepén egy inszerció/deléció található, amely 16 maradékot fed le (Supplementary File 3H).
A tripszin-inhibitor piguamerin esetében az újonnan szekvenált géntermékünk 46%-os hasonlóságot mutat az eredetileg a Hirudo nipponiából származó archetipikus szekvenciával (GenBank accession number P8149939). Az archetipikus szekvencia tíz ciszteinmaradványt tartalmaz, és ezek közül hat konzervált helyzetben van az új szekvenciában. Az összehangolásban nincsenek indelek (Supplementary File 3I).
A H. medicinalis példányunkból származó szekvencia az antistasin esetében 36%-os hasonlóságot mutat a Haementeria officinalisból származó archetipikus szekvenciával (GenBank accession number P1535840). Ezenkívül az archetipikus szekvenciában található 21 ciszteinből 18 helyzete konzerválódik a szekvenciák között (Supplementary File 3J).
A bdellastasin újonnan származtatott szekvenciánk a bdellastasin igazításában szinte teljes konzerváltságot mutat (99,9%-os hasonlóság a közös aminosavhelyeken) a szintén a Hirudo medicinalisból származó archetipikus variánshoz (GenBank accession number 1C9P41) képest. A 10 cisztein pozíciója teljesen konzervált a szekvenciák között (Kiegészítő fájl 3K).
Az ismeretlen trombininhibitor, amely itt archetipikus véralvadásgátlóként szolgál, eredetileg a Pontobdella macrothela (Schmarda, 1861) piscicolidból származik (lásd16), miután BLAST-alapú találatokat kaptunk a Haemadipsa sylvestris Blanchard, 1894 haemadipsid piócából származó feltételezett trombininhibitorral szemben. A Hirudo medicinalis-ból származó szekvenciánk csak 28%-os szekvencia-hasonlóságot mutat a közös aminosavhelyek tekintetében, ugyanakkor a célszekvenciában található nyolc cisztein-maradékból hétnek a pozíciója teljesen konzervált az újonnan szerzett szekvenciában. Érdekes módon az új szekvencia közepén egy nagy, 27 aminosavból álló inszerció található; alternatívaként ez egy törlés az archetipikus szekvenciában (Supplementary File 3L).
Génfák
A 16 piócából származó feltételezett antikoaguláns mindegyikére vonatkozóan a Wilkinson et al.42 által javasolt terminológiát használva írjuk le a gyökértelen fa topológiákat, amelyben a gyökértelen fában a “klán” potenciálisan egy monofiletikus csoportnak felel meg a gyökeres fában, a “szomszédos csoport” pedig a testvércsoportnak.
A destabiláz I génfáján (2A ábra) az újonnan szerzett szekvencia klánt alkot, bár meglehetősen alacsony támogatottsággal (valószínűségi bootstrap-támogatás = 72%), a Hirudo medicinalis31 korábbi szekvenálási erőfeszítéseiből kinyert archetipikus szekvenciával és számos variánssal.
Az LDTI (2B. ábra) esetében az új szekvencia az antikoaguláns összes archetipikus változatával klánt alkot (LBS = 100%) – vegyük észre, hogy az elágazások hossza nagyon rövid vagy nulla ebben a szekvenciacsoportban, ami alátámasztja a köztük lévő ortológia fogalmát.
Az újonnan származtatott hirudin-szekvenciánk szintén egy klánt alkot a trombin-inhibitor két archetipikus változatával (LBS = 97%) (3A ábra), amelyek a Poecilobdella viridis (Blanchard, 1864) és a Hirudo verbana hirudinida piócából származnak. Az elágazáshosszok ismét elhanyagolhatóak. A fa továbbá megerősíti a 3. hirudinszerű faktorra vonatkozó BLAST-eredményeket, mivel a H. medicinalisból származó újonnan származtatott szekvenciánk egy klánt (LBS = 87%) alkot a Hirudo orientalisból származó archetipikus szekvenciával.
A bdellin fán (3B ábra) az új szekvencia – bár alacsony támogatottsággal – klánt alkot (LBS = 26%) az archetipikus szekvenciával, valamint a Hirudo nipponia, Hirudo medicinalis és Macrobdella decora korábban szekvenált változataival. Az új szekvencia és az archetipikus szekvencia közötti elágazás hossza nagyon rövid, ami megerősíti a hasonlóságon alapuló homológiameghatározást (lásd fentebb).
Az eglin C esetében az új szekvencia klánt alkot (LBS < 75%) az archetipikus változattal; megjegyzendő, hogy annak a piócának a fajszintű azonossága, amelyből az archetipikus szekvencia származik, ismeretlen. Ezenkívül a klán tartalmaz egy szekvenciát, amely egy külön szekvenálási kísérletből származik a Hirudo medicinalis számára (nem publikált), és ezen a klánon belül az elágazások hossza nagyon rövid vagy nulla (Supplementary File 4A).
A véralvadásgátlók antistasin-családjának tagjaiból konstruált fán (Supplementary File 4B) a H. medicinalisból származó “ghilanten” szekvenciánk klánt alkot (LBS < 75%) három másik szekvenciával, amelyek a Heptacyclus cf. viridusból, a Placobdella kwetlumyéből és a Pontobdella macrothelából származnak. Ez a klán a szomszédos csoportja annak a klánnak, amely a therostasin archetipikus szekvenciáját, valamint e gén számos változatát tartalmazza különböző piócafajokból. Ezzel szemben a ghilanten archetipikus szekvenciája egy klánt alkot (nagyon rövid ághosszúsággal) az antistasin archetipikus szekvenciájával, a gyökértelen fa egy távolabbi szakaszán. Így az újonnan származtatott ghilanten szekvencia azonossága még mindig vitatható, de ésszerűnek tűnik azt feltételezni, hogy inkább a therostasinhoz, mint a ghilantenhez tartozik. A therosztaszinnal közvetlenül összehasonlítva (az adatok nem láthatóak), az új szekvencia 43%-ot mutat, ami 11%-os javulást jelent a ghilantenhez való igazodáshoz képest (lásd fentebb). A H. medicinalis adatkészletben található többi antisztázin-családba tartozó fehérje mindegyike klánokat alkot a megfelelő archetipikus véralvadásgátlóval. A bdellastasin, a piguamerin és a guamerin esetében az újonnan származtatott szekvenciák mindegyike az archetipikus változatok szomszédos szekvenciájaként fészkel be. Az antistasin esetében a szekvenciánk egy nagyobb klánban helyezkedik el, amely több piócafajból származó szekvenciákat, valamint mind a ghilanten, mind az antistasin archetipikus változatait tartalmazza.
A cisztatin esetében csak három további, összehasonlító szekvencia állt rendelkezésre a mátrix alapjául. Az adatok szűkössége ellenére az új szekvencia egy klánt (LBS < 75%) alkot az archetipikus szekvenciával, és az elágazás hossza hasonló a többi termináléhoz (Supplementary File 4C).
Mivel a ficolin esetében nem áll rendelkezésre archetipikus, piócából származó szekvencia, az új szekvenciánk egy klánt alkot egy korábban (publikálatlanul) H.-ból származó változattal együtt. medicinalisból (LBS = 100%), a szekvenciákat nulla ághossz választja el egymástól (4D kiegészítő fájl).
A Kazal-típusú szerinproteáz-inhibitorok fája (4E kiegészítő fájl) egyike azon kevés szekvenciáknak, amelyeket piócaszekvenciákból valaha is felépítettek, és ez mind a piócából származó archetipikus változatok, mind az összehasonlító adatok hiányában (csak négy szekvencia alkotja a mátrixot) megmutatkozik. Az új szekvenciánk egy klánt alkot (LBS = 51%) a Haemadipsa interrupta-ból származó változattal.
A C-típusú lektin fán (4F kiegészítő fájl) a legjobb találat szekvenciája egy nem támogatott klánt alkot (LBS < 75%) az Aliolimnatis fenestrata és a Hirudo medicinalis afrikai orvosi piócából származó változatokkal. Ez a klán viszont az archetipikus szekvencia szomszédos csoportja.
A hasonlóságon alapuló ortológia-meghatározást megerősítve, az újonnan származtatott manilláz-szekvenciánk egy klánt alkot az archetipikus szekvenciával és két másik, a Limnobdella mexicana és a Haemadipsa interrupta praobdellidből származó szekvenciával. Tekintettel erre az elhelyezésre és a szekvenciánkhoz vezető ág hosszára, aligha kétséges, hogy a manilláz ortológját képviseli (Kiegészítő fájl 4G).
A BLAST, az összehangolás és a génfa-elemzések eredményei együttesen azt sugallják, hogy a következő piócából származó fehérjetermékek mindegyike jelen van a H. medicinalis genomban: eglin C, destabiláz I, ghilanten, piócából származó triptáz inhibitor (LDTI), guamerin, cisztatin, hirudin, ficolin, Kazal-típusú szerinproteáz inhibitorok (szerpinek), C-típusú lektin, manilláz, bdellin, piguamerin, antistasin, bdellastasin és egy azonosítatlan trombinin inhibitor.
Leave a Reply