Index Vakbarát Hírportál

Olyan hülyék a számítógépek, hogy szappanbuboréknak nézik egy fiú fejét

2014. november 18., kedd 13:42

Különleges számítógépes megoldáson dolgozik a Stanford Egyetem és a Google egy közös munkacsoportja. A cél az, hogy a gépek intelligenciája képes legyen felismerni, amit egy neki mutatott képen lát.

Az nem újdonság, hogy az alakzatokat felismerő algoritmusok képesek bizonyos tárgyakat vagy élőlényeket nagy pontossággal felismerni, a cél az, hogy egyes élethelyzeteket, szituációkat is nagy biztonsággal azonosítani tudjanak. Tegyük fel, hogy ezt a képet megmutatjuk egy jól felkészített programnak:

Azt az eredményt kapjuk majd, hogy ezen a képen egy alacsony ember van egy lóval, ami tulajdonképpen igaz, de ha ezt élő ember elolvassa, rögtön egészen tekervényes úton eljut valami olyan értelmezéshez, amin vigyorognia kell. Szóval a Google és a Stanford célja az, hogy a gépek inkább azt mondják, hogy ez itt egy lovát vezető zsoké.

A rendszer két alrendszerből épül fel, az egyik a képek tartalmát ismeri fel, a másik pedig megpróbálja a lehető legkevésbé hülyén megfogalmazni a látottakat az angol nyelvi szabályok segítségével. Ahhoz, hogy megtanulja, mi micsoda, a fejlesztők rengeteg, előre felcímkézett képet mutatnak meg neki, viszont az algoritmus már a jelenlegi fejlettségi szinten is kétszer olyan hatékonyan tippeli meg, mit lát, mint a korábbi megoldások.

Mondjuk a mellékelt ábra azért kiválóan bemutatja, mennyire az elején tart még a projekt: a program a fő alkotóelemeket legtöbbször helyesen beazonosítja, de ez nem elég ahhoz, hogy ne orbitális baromságokat lásson a képekre. Az csak egy dolog, hogy pirosnak nézi a rózsaszínt vagy hűtőnek a telematricázott KRESZ-táblát, de mikor a képen szereplő kutyákat sem tudja megszámolni, vagy szappanbuboréknak nézi egy fiú fejét, akkor lehet megnyugodni igazán, milyen messze vagyunk még az emberiséget nyomorba döntő roboturalomtól.

Viszont ha egyszer tényleg használható technológia válik a dologból, az a hétköznapi életben is rengeteg segítséget jelent majd, hiszen a számítógépek az utcai kamerák képét figyelve képesek lesznek maguktól reagálni és emberi segítséget hívni például akkor, ha valaki összeesik az utcán, vagy baleset történik egy kereszteződésben.

Rovatok