Index Vakbarát Hírportál

Szájról olvas a mesterséges intelligencia

2016. november 9., szerda 10:24

Az Oxfordi Egyetem kutatói olyan mesterséges intelligenciát fejlesztettek, ami szájról is olvashatja az emberi beszédet. Akik látták a 2001: Űrodüsszeiát, valószínűleg a szívükhöz kapnak a hír hallatán; a filmben az űrhajó mesterséges intelligenciája is ezzel a trükkel derítette ki, hogy a személyzet le akarja állítani, így ellenük fordult. Ettől egyelőre nem kell tartanunk. Bár a rendszer leolvasási pontossága több mint 90 százalékos, a kritikusok szerint ez nem meglepő, mivel a teszt során a mesterséges intelligenciának egyszerű adatokkal kellett dolgoznia.

A LipNet nevű rendszer megfigyeli az adott személy szájmozgását, és 93 százalékos pontossággal illeszti hozzá a szöveget. A fejlesztők úgy vélik, a módszer automatizálása millióknak nyújthat segítséget, de a szakértők szerint az eljárást nemcsak videókkal, hanem valós helyzetekben is tesztelni kell.

A diktálástól a némafilmig

A szájról olvasás komoly szakértelmet kíván. A fejlesztők azonban úgy látják, az új fejlesztéssel javítani lehetne a hallókészülékek működésén, a zajos helyeken könnyebbé válna a diktálásos jegyzetelés és a beszédfelismerés, sőt, a biometrikus azonosítás és a némafilm-szinkronizálás területén is felhasználható.

A rendszer betanításához az egyetem kutatói csaknem 29 ezer, egyenként 3 másodperces videót elemeztettek a mesterséges intelligenciával. A videókhoz csatolták a száj által kimondott szöveget is, hogy a rendszer megteremtse a kettő közötti összefüggést. Az eredmények elég meggyőzők: a teszteléssel megbízott emberek hibázási aránya 47,7 százalék volt, de a mesterséges intelligencia csak 6,6 százalékban tévedett.

A szakértők szerint a technológia ígéretes, de közel sem átütő erejű.

Bár a rendszer jobban olvashat szájról, mint az emberek, ezt csak azért teheti meg, mert egy értelmetlen szóhalmazzal dolgozom egy erősen korlátozott szókincsből, megadott sorrend szerint.

– írta Neil Lawrence az OpenReview-ban.

A projektet részben a Google mesterséges intelligenciával foglalkozó részlege a DeepMind fizette.

Rovatok