Index Vakbarát Hírportál

A Google valós idejű tolmácsgépet mutatott be

2019. május 17., péntek 08:56

A Translatotron névre keresztelt kísérleti projekt pontosan azt csinálja, amit egy tolmácsgéptől várna az ember, aki Star Trek-rajongóként pontosan tudta eddig is, hogy a gördülékenyen működő univerzális fordítót egyszer mindenképpen fel fogják találni. Vagyis a hallott szöveget rögtön egy másik nyelven mondja vissza.

Ez nem nagy kunszt, gondolhatnánk, hiszen az efféle rendszerekhez szükséges résztechnológiák (a beszédfelismerés, az írott szöveg fordítása, majd annak gépi kimondása) eddig is rendelkezésre álltak.

Csakhogy itt egyáltalán nem erről van szó.

A Translatotron ugyanis egy lépésben fordítja a hallott szöveget a másik nyelvű beszédre. Ezzel a fejlesztők szerint nemcsak gyorsabb lett, de követni tudja az eredeti beszéd hanghordozását is, valamint a lépések számának csökkentésével a hibázási lehetőség is kevesebb.

A Google és mások már évek óta dolgoznak a közvetlenül fordító algoritmus kifejlesztésén, de csak a legutóbbi időkben értek el jelentős haladást. Az algoritmus, amit most bemutattak, a beszéd spektrogramját elemzi. A spektrogram a hangok frekvenciájának időbeli ábrázolása, az alábbi ábrán a hangosabb frekvenciatartományok a sárga területek.

Az algoritmus pontos működési mechanizmusa részleteiben nem ismert, hiszen gépi tanulásos mechanizmusról van szó, de végeredményben az egyik nyelven mondott szöveg spektrogramját fordítja a másik nyelvű szöveg spektrogramjára, és azt rögtön ki is mondja. Ez a módszer lehetővé teszi, hogy nagyon természetellenesen hangzó gépi szöveg helyett egészen emberi intonációjú mondatok hangozzanak el a gép torkából. Hiszen

a hanghordozás a spektrogramon jól elkülöníthető jellegzetesség a kimondott szavaktól, így azt klónozni lehet az új nyelvű szövegre is.

Persze az egylépcsős fordításnak megvan a maga hátránya is - legalábbis a rendszer jelenlegi fejlettségi fokán. A fő hátrány, hogy a fordítás pontossága ma még nem éri el a hagyományos beszéd-szöveg-lefordított szöveg-beszéd kaptafára működő fordítások pontosságát.

Forrás: Techcrunch

Rovatok