Az Oxfordi Egyetem kutatói olyan mesterséges intelligenciát fejlesztettek, ami szájról is olvashatja az emberi beszédet. Akik látták a 2001: Űrodüsszeiát, valószínűleg a szívükhöz kapnak a hír hallatán; a filmben az űrhajó mesterséges intelligenciája is ezzel a trükkel derítette ki, hogy a személyzet le akarja állítani, így ellenük fordult. Ettől egyelőre nem kell tartanunk. Bár a rendszer leolvasási pontossága több mint 90 százalékos, a kritikusok szerint ez nem meglepő, mivel a teszt során a mesterséges intelligenciának egyszerű adatokkal kellett dolgoznia.
A LipNet nevű rendszer megfigyeli az adott személy szájmozgását, és 93 százalékos pontossággal illeszti hozzá a szöveget. A fejlesztők úgy vélik, a módszer automatizálása millióknak nyújthat segítséget, de a szakértők szerint az eljárást nemcsak videókkal, hanem valós helyzetekben is tesztelni kell.
A szájról olvasás komoly szakértelmet kíván. A fejlesztők azonban úgy látják, az új fejlesztéssel javítani lehetne a hallókészülékek működésén, a zajos helyeken könnyebbé válna a diktálásos jegyzetelés és a beszédfelismerés, sőt, a biometrikus azonosítás és a némafilm-szinkronizálás területén is felhasználható.
A rendszer betanításához az egyetem kutatói csaknem 29 ezer, egyenként 3 másodperces videót elemeztettek a mesterséges intelligenciával. A videókhoz csatolták a száj által kimondott szöveget is, hogy a rendszer megteremtse a kettő közötti összefüggést. Az eredmények elég meggyőzők: a teszteléssel megbízott emberek hibázási aránya 47,7 százalék volt, de a mesterséges intelligencia csak 6,6 százalékban tévedett.
A szakértők szerint a technológia ígéretes, de közel sem átütő erejű.
Bár a rendszer jobban olvashat szájról, mint az emberek, ezt csak azért teheti meg, mert egy értelmetlen szóhalmazzal dolgozom egy erősen korlátozott szókincsből, megadott sorrend szerint.
– írta Neil Lawrence az OpenReview-ban.
A projektet részben a Google mesterséges intelligenciával foglalkozó részlege a DeepMind fizette.