Articles / augusztus 20, 2021

Hogyan működik a Shazam

A Shazam lehetővé teszi, hogy elküldje a telefonjával készített felvételt szinte bármilyen dalról, és a Shazam megmondja a dal nevét, az előadó nevét és egyéb adatokat a dalról. Ezek az egyéb adatok gyakran tartalmaznak linkeket olyan helyekre, ahol meg lehet vásárolni a dalt, valamint az előadó közelgő turnéjának időpontjait. Az elmúlt években a Shazam kiterjesztette könyvtárát a reklámokra és a televízióra is. Például Shazamolhat egy reklámot, és további információkat kaphat a termékről, beleértve a termék megvásárlásához vezető linket is.

A Shazam 1999-ben alakult, és régebbi, mint az okostelefon. A Shazam korai időszakában a felhasználók egy olyan készülékkel hívták fel, amely így nézett ki

A Shazam keresés még zajos környezetben, például bárokban vagy szórakozóhelyeken is képes találni egyezést, amennyiben az adott dal már szerepel a Shazam adatbázisában. A legjobb eredményt egy legalább öt másodperces felvétel adja. A dal bármely pontján elkezdheti a felvételt, és a Shazam néhány másodperc alatt elküldi a találatot. Ahhoz, hogy ez a szolgáltatás jól működjön, a Shazam több mint 8 millió dalból/hangfájlból álló, egyre növekvő adatbázissal rendelkezik. Ha feltételezzük, hogy egy átlagos hangfájl három perc hosszú, akkor több mint 45 évbe telne, hogy mindegyiket visszamenőleg lejátsszuk!

Egy ekkora adatbázissal nagy lefedettséggel rendelkeznek, de hogyan talál a Shazam ilyen gyorsan egyezést egy ilyen nagy adatbázisban? Először is, nem a tényleges hangfájlokat keresik, amikor a Shazam egy dalt keres. Ehelyett a Shazam az adatbázisban található minden egyes hangfájlhoz rendelkezik egy audio-ujjlenyomattal. A Shazam-felhasználó által beküldött felvételből is készül egy audioujjlenyomat, amely lehetővé teszi a pontos és gyors összehasonlítást. Ezek a hangujjlenyomatok numerikus adatok gyűjteményeiből állnak. Ha kíváncsi vagy, hogyan alakul számokká ez a fülbemászó dallam, amit Shazam-ozol, a következő rész neked szól.

Hogyan működik a hang

A legalapvetőbb definíció szerint a hang rezgő részecskék. Minden hangot három elem tesz egyedivé: Amplitúdó, frekvencia és idő. Az amplitúdó a rezgés nagysága, amit mi a hang hangerősségként érzékelünk. A frekvencia az a sebesség, amellyel a rezgés történik. A hang frekvenciája az, amit hangmagasságként érzékelünk. A frekvenciát hertzben (Hz) mérik, ami azt jelenti, hogy egy hanghullám másodpercenként hányszor ismétlődik. Az emberi fül 20 Hz és 20 000 Hz közötti hangokat hall. Hogy némi perspektívát adjunk, a hagyományos 88 billentyűs zongora legalacsonyabb hangja, az A0 frekvenciája 27,5 Hz. A zenei hangmagasság frekvenciája minden oktávban logaritmikusan növekszik. Más szóval, minden egyes oktáv frekvenciája kétszer akkora, mint az alatta lévő oktávé. Például az A1 frekvenciája 55Hz, az A2 frekvenciája 110Hz, az A3 frekvenciája pedig 220Hz.

Universe

Hogyan működik a Shazam

Leave a Reply Cancel