Index Vakbarát Hírportál

Kedves Olvasók, kapcsoljuk a Poklot!

Kék farmer és véres könnyek

2020. november 22., vasárnap 17:30

Ismerkedjünk a jövővel. A mesterséges intelligencia által generált zene megfagyasztja a vért. Ahogy egy kifinomult kommentelő fogalmazott: 2020-ban így játsszuk le a zenét visszafelé. Ferenc pápa értetlenül áll a történtek előtt.

Mint ismert, az elektromos autózás és a Sátán földi helytartója, Elon Musk maga is az alapítók között volt a San Franciscó-i Open AI-ban 2015-ben. A neurális hálózatokon alapuló betanított mesterséges intelligenciát fejlesztő cég leginkább az idén nyáron bemutatott termékéről, a GPT-3-ról ismert, az pedig nem más, mint egy ötmillió dollár költséggel százmilliárd szavas adatbázison betanított, az embert majdnem tökéletesen utánzó szöveggenerátor.

De nem csak az újságírók kenyerét próbálják elvenni, játékosrobotokat is programoznak. Open AI Five nevű terméküket elektronikus sportokban indítják, és DOTA 2-ben a világbajnokokat is beleértve mindenkit legyőznek.

Nem utolsósorban: szintén idén tavasszal mutatták be Jukebox nevű terméküket, amely zene és ének generálására képes. A Jukeboxot 1,2 millió hangmintával tanították be. Zene generálásához megadható műfaj, előadó, dalszöveg.

Mélyen hamis

Az Open AI szerint a dalok „helyi koherenciát mutatnak, és követik a tradicionális akkordmintázatokat”, de hiányoznak belőlük „a nagyobb zenei struktúrák, például az ismétlődő kórus”. 

A szöveggenerátorral szemben a mesterségesen generált zene jelentős lemaradásban van az emberi produkcióhoz képest, leginkább a tusolás közben az agyban olvadozó napi zaj zsizsegéséhez hasonlatos, ahhoz viszont elég jó, hogy úgynevezett zenei deepfake-eket állítson elő. A deepfake, ha valaki nem ismeri, egy mesterséges intelligenciával végrehajtott képmanipuláció, amivel egy mozgóképben bárki arca bárki máséra cserélhető felismerhetetlenségig tökéletes minőségben.

A zenei deepfake ennek megfelelően például egy mesterségesen generált, soha nem létezett, de majdnem tökéletes Frank Sinatra-dal. Az persze a kevésbé avatott fülnek is feltűnik, hogy a dalszöveg valahogy a karácsonyt és a forró fürdőt zagyválja, és végeredményben szürreális. Az elkárhozottak sikolyai – írja egy hozzászóló.

Ez még csak a kezdet

A zenei kiadók briftasnijukat markolva feszülten figyelik a fejleményeket. A Roc Nation például már leszedette a YouTube-ról a Shakespeare-t rappelő Jay-Z-t. Az igazi jogi problémák azonban ott kezdődnek, amikor valaki pénzért ad el deepfake zenét, és a kiadónak kell bizonyítania, hogy egy mesterséges intelligencia illetéktelenül parodizálja protezsáltja produkcióját.

A Jukebox egyszerre szórakoztatóan ijesztő és zsibbasztó. A történet lényege végső soron az, amit a jövő tartogat. Ahogy a GPT-3 szövegeinek minősége teljesen más dimenziót jelent elődjéhez, a GPT-2-höz képest, a Jukebox következő generációja már jóval kevésbé pokoli produkciókra lesz képes, tehát hosszú távon Elonék a zenészek szájából is kiéneklik a croissant-t.

Zárásnak álljon itt egy deepfake mesterséges intelligencia által generált, emberek által előadott euroviziós dal, a Kék Farmer és Véres Könnyek.

Rovatok