A mesterséges intelligencia és azon belül is a mélytanulási algoritmusok bevetésével egyre könnyebb egyre hihetőbb kamuvideókat gyártani, ami az álhírek elburjánzásának korábban újabb frontot nyithat az információs háborúban és a félelmek szerint tovább erodálhatja a demokráciát. Ennek az álvideógyártási forradalomnak volt emblematikus sarokköve a Deepfake nevű algoritmus, amely főleg a hírességekről készített kamu pornóvideókról vált hírhedtté.
A New York-i Állami Egyetem kutatói most előálltak egy módszerrel, amellyel a technológia jelenlegi fejlettségi szintjén viszonylag egyszerűen kiszűrhető, ha egy videó ezzel a módszerrel készült, vagyis a benne látható karaktert számítógéppel generálták – írja a Register.
A még publikálás előtt álló tanulmány szerint az emberek átlagosan percenként 17-szer, avagy másodpercenként 0,283-szor pislantanak, ami az olvasással lassul, a párbeszédekkel pedig gyorsul. A ma gyártott kamuvideók viszont ezt a tényezők nem veszik számításba, egészen egyszerűen azért, mert az arcfelismeréshez- és generáláshoz használt mélytanulási algoritmusok tréningezéséhez használt adathalmazokban csak elvétve akadnak csukott szemű embereket ábrázoló képek.
A kutatók a megoldást is algoritmusokban látják: a szem csukott állapotát automatikusan detektáló és mérő szoftverek szerintük ki tudják szúrni, ha egy videót mesterségesen generáltak. Ehhez készítettek egy saját programot is, amely állításuk szerint pontosabb, mint az eddig elérhető hasonló megoldások.
Azt persze a kutatók is elismerik, hogy ez a módszer jobb esetben is csak ideiglenesen válhat be, hiszen folyamatos a fegyverkezési verseny, így előbb-utóbb nyilván a mesterséges pislogtatás is elég fejlett lesz ahhoz, hogy túljárjon a mesterségespislogtatás-detektáláson. A kutatók szerint ezért érdemes lenne további olyan fiziológiai jeleket is azonosítani, amelyeket még nem tudnak reprodukálni a Deepfake-hez hasonló algoritmusok.