Képeket nézve tanul egy számítógép

Az embereknek könnyen megy a vizuálisan befogadott információk összekapcsolása, de a számítógépek esetében ez nem ilyen egyértelmű: általában meg kell mondanunk nekik, mit látnak a képen. A Carnegie Mellon Egyetemet működtetett Never Ending Image Learner (Végtelen Képfeldolgozó) nevű gép az egyik olyan kivételes gép, akinek nincs szüksége emberi mankóra.

A 200 processzormagos gép az internet képeit vizsgálja meg, és a felismert tárgyak alapján állít fel összefüggéseket. Tudja például, hogy az épületek általában magasak, a kerék általában része egy autónak, a ferde torony Pisában épült fel, zebrákkal általában a szavannákon találkozunk, és hogy a vadkacsák hasonlítanak a vadludakra. Néha persze téved is, egy mindenki által elérhetővé tett oldalon megnézhetjük, mit tud már a gép, és jelezhetjük, ha a egy megállapítása sántít. Például hogy a csatornákban lehet pulyka.

A projekt hosszú távú célja az, hogy a számítógépek és robotok maguktól is értelmezni tudják az őket körülvevő világ vizuális jeleit. A Carnegie Mellonon nem ez az első eset, hogy lexikális tudás megszerzését próbálják automatizálni, egy korábbi kísérletben kvízbajnok gépet fejlesztettek, ahol sporttal és zenével kapcsolatos kérdésekben sikerült verhetetlen gépet összerakni. Bár ott is voltak gondok: az internetes böngészőkben használt, sütinek hívott adatcsomagok félrekategorizálása után igen körülményes volt meggyőzni a gépet arról, hogy a valódi, tésztából készült édességet nem lehet kitörölni.

Index Vakbarát Hírportál

Képeket nézve tanul egy számítógép

Rovatok