A Meta beszédszintetizálója megtévesztően jól utánozza az emberi hangot, a visszaélések elkerülése miatt egyelőre nem is merik elérhetővé tenni.
Az úgynevezett generatív mesterséges intelligencia a chatbotok által vált ismertté, de a technológia képek, videók, sőt emberi beszéd generálására is képes. Annyira gyorsan fejlődik, hogy sokszor nem is derül ki, hogy gép áll a háttérben. A visszaélések ezzel párhuzamosan megkezdődtek.
Áprilisban az amerikai Arizona államban számolt be a helyi média egy hamis emberrablásról, amelyről kiderült, hogy egy beszédgenerátor szólalt meg telefonban egy kislány hangján, és a hívásban egymillió dolláros váltságdíjat követeltek az anyától a gyerek életéért. A halálra rémült nő beszaladt lánya szobájába, aki ott csodálkozva fogadta az esetet.
Az FBI kinyomozta, hogy a tinédzser közösségi médiában közzétett videóinak hangmintájából generálta a szoftver a segélykérő hívását. A hatóság az ilyen esetek elkerülése miatt azt tanácsolta, hogy az ilyen tartalmak elérhetőségét érdemes szűk körre korlátozni.
A Facebookot üzemeltető vállalat, a Meta most jelentette be, hogy az úgynevezett Voicebox beszédszintetizációja a legnépszerűbb rendszereknél jóval élethűbben, megtévesztően jól képes az emberi hangot utánozni – írta a TechRadar portál.
Az eszköz angolul, franciául, németül, spanyolul, a portugál mellett lengyelül képes megszólalni. A cég ugyan beszámolt a minden riválisát leköröző programjukról,
de a lehetséges visszaélések miatt nem merik még elérhetővé tenni.
A szoftvert alapvetően a néma emberek segítésére és idegen nyelvre való fordításhoz fejlesztették ki.