Index Vakbarát Hírportál

Mesterséges intelligencia teszi elviselhetővé a karaoke előadásokat

2019. február 18., hétfő 11:50 | aznap frissítve

Noha már jó ideje léteznek olyan számítógépes eljárások, amelyek igyekeznek kijavítani a botcsinálta énekesek fülsértő próbálkozásait, ezek sokszor észrevehetően, sőt zavaróan természetellenes hangzást eredményeznek. Egy új algoritmus viszont egészen kiemelkedő eredményt hoz azáltal, hogy nem törekszik a tökéletességre, inkább próbál alkalmazkodni az illető képességeihez.

A pop-iparban a hangfelvételek csiszolására használt számítógépes eljárások legtöbbje végigmegy a dalon, és egyezteti az énekes által kiénekelt és a kottában szereplő hang magasságát egymással. Ahol eltérést talál, ott az énekhang frekvenciáját úgy módosítja, hogy az megfeleljen az előírtnak. Az eljárás azonban csak bizonyos fokú hamisságig működik, mivel ha túl sok hangot kell helyretenni, akkor a hangzás inkább a robotok beszédére fog hasonlítani.

Ezt a problémát küszöbölte ki Sanna Wager, az Indianai Egyetem komputertudósa, aki sok szörnyűséget hallhatott már életében, hiszen a több mint 50 millió aktív felhasználóval rendelkező Smule karaoke appnál töltötte gyakornoki idejét.

Több mint 5000 karaoke-hangmintán tréningelte az általa alkotott mesterséges intelligenciát, amely ezáltal megtanulta, hogy hogyan szűrje ki a hibás hangokat, és hogyan hozza helyre őket úgy, hogy az ének stílusa ne sérüljön. Az algoritmus újdonsága tehát az, hogy nem (feltétlenül) a kottában szereplő tökéletes hangig tolja el a kiénekelt hang magasságát és hangszínét, hanem

csak annyira, hogy az illeszkedjék a felvétel egyéb hangjainak világába.

Amikor arról kell döntenünk, hogy hogyan korrigáljunk egy hibás hangot, meg kell vizsgálnunk, hogy az énekes mit művelt a hangot megelőző másodpercekben

- nyilatkozta Wager a New Scientistnek. A kutatócsoport honlapján számos eredeti és javított felvétel elérhető, de a itt is meghallgathatják, hogy mit tud a program:

A lap által megkérdezett zenei producer szerint az algoritmus által feljavított felvételek egészen kiválóak. Bár jelenleg még csak a kész felvételeken fut, Wager szerint a fejlesztés iránya a valós idejű, karaoke-bárokban is alkalmazható működés lehet.

Ez kétségtelenül sok szenvedéstől szabadítaná meg a világot.

Forrás: New Scientist

Rovatok