Index Vakbarát Hírportál

Mindennapossá válik, hogy emberi hangon szól hozzánk a gép?

2023. október 11., szerda 08:39

A deep fake-et eddig úgy ismertük, mint azt a technikát, amikor a mesterséges intelligencia egy videón lecseréli valaki arcát. A generatív mesterséges intelligenciák színre lépésével a hamisítás új szintre lépett, és bárki hangját könnyen utánozhatóvá teszi.

A hazai kiberbiztonsági szakma október 11–12-én újra összegyűlik a Groupama Arénában, hogy a mesterséges intelligencia jövőjéről, veszélyeiről, felhasználásáról elmélkedjen. Gyires-Tóth Bálint, a BME docense a hangmanipuláció bővülő lehetőségeinek következményeiről beszél majd.

A generatív MI nem csak az írószakmák művelőinek okozhat egzisztenciális szorongást, a hangklónozás által más előadóművészi területeket is fenyeget. Pár hete pattant ki az ügy, amikor egy közismert brit színész, Stephen Fry hangját klónozták, az általa felmondott Harry Potter-hangoskönyvekből és engedélye nélkül egy történelmi dokumentumfilmhez generáltak vele narrációt. A szakember szerint az eset számos jogi és etikai kérdést vet fel.

Egyrészt szükséges tisztázni, hogy milyen típusú jogot lehet formálni egy adott személy hangjára. Tulajdonjogot, szerzői jogot, védjegyet, szabadalmat? Esetleg többet egyszerre, vagy egyiket sem? Ezen túl meg kell határozni, hogy mit is jelent az „adott személy hangja”. Nyilván először az adott személy hangszínére gondolunk, de legalább ennyire jellemző lehet a beszédritmus, intonáció és sok más egyéb paralingvisztikai jellemző. Továbbá a hasonlóság mértékét is számszerűsíteni kell: mikor mondjuk, hogy azonos két hang, mikor hasonlít, és mikor különbözik? És ráadásul, ha mindebben a szakértők meg tudtak egyezni, országok között is össze kell hangolni az irányelveket

– mutatott rá Gyires-Tóth.

A mesterséges intelligencia hatása azonban másfajta előadásokra is kiterjed: akár a napi politikai közéletet is átrajzolja. A Szlovákiában nemrég rendezett parlamenti választások kampányában például klónozott beszédhangon alapuló dezinformációk is felbukkantak.

Ilyen tekintetben úgy gondolom, hogy egy-egy új megoldás helytelen használatára addig kell igazán figyelni, ameddig széles körben nem válik ismertté. Tegyük fel, hogy az emberek mindennapjainak részévé vált a hangklónozás – például a tévében már minden film szinkronját köztudottan hangklónozással hozzák létre, a kocsiban a navigáció a gyerekünk hangján beszél, az ügyfélszolgálati kiosk közszereplő hangján szólal meg satöbbi –, akkor már sokkal kisebb tere és hatása lehet az ilyen jellegű visszaéléseknek

– fogalmazott Gyires-Tóth Bálint, aki az ITBN idei konferenciáján Kovács Gyulával, a Neuron Solutions Kft. ügyvezetőjével beszélget ilyen és ehhez hasonló kérdésekről.

Rovatok