Hány szótagot tartalmaz a “Fire”?

X

Adatvédelem & Sütik

Ez az oldal sütiket használ. A folytatással Ön hozzájárul ezek használatához. Tudjon meg többet, beleértve a sütik ellenőrzését.

Megvan!

Hirdetések

Nézegettem a VirtualSinger programot, és az egyik dolog, amit érdekesnek találok, az az, hogy hogyan kezeli a szótagokat. Alapvetően kötőjelekből számolja ki, hogy hány hangra oszlik egy szó, de automatikusan újra kötőjelez azzal a szabállyal, hogy minden hangra egyetlen magvú magánhangzó hang jut.

A felszínen ez egy elég ügyes megoldás… de vannak olyan szavak, amelyek ártatlannak tűnnek, de gondot okoz, ha megpróbáljuk meghatározni, hogyan kell kezelni őket.

A “tűz” az egyik ilyen szó, amely gondot okoz, mert fonetikailag az /F AY ER/, amelynek két “magvú” magánhangzója van – /AY/ és /ER/. Mégis a legtöbbször egyetlen szótagként ejtjük.

Hogyan kellene ezt kezelni? Mind a VirtualSingerben, mind a synSingerben folyamodhatunk a fonémák kiírásához, de ez meglehetősen csúnya megközelítés.

A synSinger megközelítése egy hibrid. Először felépíti a szót a jegyzetekből, majd ellenőrzi a CMU-szótár egy helyi példányát. Ha egyezik: nagyszerű! A probléma megoldva.

Ha azonban nincs egyezés, akkor a dolgok eldurvulhatnak. Ezután továbbítja a szót a Reciter módosított változatának, amely a szót az eredeti betűkkel párosított fonémákká alakítja. Például a CATTLE szóból C:K A:AE T:T T:T L:L E:EH lesz. Ezután újraépíti a szót az eredeti írásmóddal, a kötőjeleket a felhasználó által kiválasztott pozícióhoz képest beszúrva.

A FIRE szóból F:F I:AY R:ER E: lesz. Tehát ha a felhasználó FIRE-t írt, az eredmény FAYER lesz, ha pedig FI-RE-t írt, az eredmény FAY-ER lesz. Mindez a színfalak mögött történik, és a legtöbbször egyszerűen úgy működik, ahogy a felhasználó elvárja.

Sajnos van valami, amit a synSinger nem csinál jól, amit a VocalWriter szépen csinál: a melizmák kezelése. Vagyis az egyetlen szótaghoz rendelt több hangot.

A VocalWriter az “=” karaktert használja a “bővítsd ki az utolsó magot” kifejezésre. Ez különösen szép, mert ezt úgy lehet írni, hogy “A FIG- =- =- =-“, és automatikusan kibővül “DHAX FIH-IH-IH-IHG”-re, az utolsó mássalhangzók megfelelő elhelyezésével.

synSinger nem támogatja ezt, így ha ilyesmit akarsz írni, azt fonetikusan kell megtenni. Ha pedig diftongussal dolgozol, akkor a végső diftongus előtti kezdeti szótagokhoz kellett találnod egy közelítő magánhangzót.

Nemrég módosítottam a synSinger-t úgy, hogy ha egy diftongus követi önmagát, csak az utolsó bővül ki teljesen. Ez egy kicsit kevésbé fájdalmassá teszi a használatát, de még mindig nem olyan szép, mint a VirtualVoice.

Szóval azt nézem, hogy a synSingerhez hozzáadom a funkciót, így “csak úgy működik”, ahelyett, hogy fonémák írásához kellene folyamodnunk.

Hirdetések

Leave a Reply