Hány szótagot tartalmaz a “Fire”?
Adatvédelem & Sütik
Ez az oldal sütiket használ. A folytatással Ön hozzájárul ezek használatához. Tudjon meg többet, beleértve a sütik ellenőrzését.
Nézegettem a VirtualSinger programot, és az egyik dolog, amit érdekesnek találok, az az, hogy hogyan kezeli a szótagokat. Alapvetően kötőjelekből számolja ki, hogy hány hangra oszlik egy szó, de automatikusan újra kötőjelez azzal a szabállyal, hogy minden hangra egyetlen magvú magánhangzó hang jut.
A felszínen ez egy elég ügyes megoldás… de vannak olyan szavak, amelyek ártatlannak tűnnek, de gondot okoz, ha megpróbáljuk meghatározni, hogyan kell kezelni őket.
A “tűz” az egyik ilyen szó, amely gondot okoz, mert fonetikailag az /F AY ER/, amelynek két “magvú” magánhangzója van – /AY/ és /ER/. Mégis a legtöbbször egyetlen szótagként ejtjük.
Hogyan kellene ezt kezelni? Mind a VirtualSingerben, mind a synSingerben folyamodhatunk a fonémák kiírásához, de ez meglehetősen csúnya megközelítés.
A synSinger megközelítése egy hibrid. Először felépíti a szót a jegyzetekből, majd ellenőrzi a CMU-szótár egy helyi példányát. Ha egyezik: nagyszerű! A probléma megoldva.
Ha azonban nincs egyezés, akkor a dolgok eldurvulhatnak. Ezután továbbítja a szót a Reciter módosított változatának, amely a szót az eredeti betűkkel párosított fonémákká alakítja. Például a CATTLE szóból C:K A:AE T:T T:T L:L E:EH lesz. Ezután újraépíti a szót az eredeti írásmóddal, a kötőjeleket a felhasználó által kiválasztott pozícióhoz képest beszúrva.
A FIRE szóból F:F I:AY R:ER E: lesz. Tehát ha a felhasználó FIRE-t írt, az eredmény FAYER lesz, ha pedig FI-RE-t írt, az eredmény FAY-ER lesz. Mindez a színfalak mögött történik, és a legtöbbször egyszerűen úgy működik, ahogy a felhasználó elvárja.
Sajnos van valami, amit a synSinger nem csinál jól, amit a VocalWriter szépen csinál: a melizmák kezelése. Vagyis az egyetlen szótaghoz rendelt több hangot.
A VocalWriter az “=” karaktert használja a “bővítsd ki az utolsó magot” kifejezésre. Ez különösen szép, mert ezt úgy lehet írni, hogy “A FIG- =- =- =-“, és automatikusan kibővül “DHAX FIH-IH-IH-IHG”-re, az utolsó mássalhangzók megfelelő elhelyezésével.
synSinger nem támogatja ezt, így ha ilyesmit akarsz írni, azt fonetikusan kell megtenni. Ha pedig diftongussal dolgozol, akkor a végső diftongus előtti kezdeti szótagokhoz kellett találnod egy közelítő magánhangzót.
Nemrég módosítottam a synSinger-t úgy, hogy ha egy diftongus követi önmagát, csak az utolsó bővül ki teljesen. Ez egy kicsit kevésbé fájdalmassá teszi a használatát, de még mindig nem olyan szép, mint a VirtualVoice.
Szóval azt nézem, hogy a synSingerhez hozzáadom a funkciót, így “csak úgy működik”, ahelyett, hogy fonémák írásához kellene folyamodnunk.
Leave a Reply