A holnap látógépei

Kísérleti idegtudományt és számítógép-tervezést közös nevezőre hozó, genetikai technikák által inspirált Harvard- és MIT-kutatók olcsó és nagyteljesítményű játékhardvert is hasznosító új módszert dolgoztak ki mesterségeslátás-rendszerek fejlesztésére.

A természetes környezet legegyszerűbb tárgyainak vizuális felismerése bonyolult neurális folyamat, utánzásáról nem is beszélve, ami sokkal, de sokkal nehezebb. A tudomány komoly eredményeket ért el a látórendszer működésének megértése terén, ám a biológiai rendszerek belső tevékenysége még így is számos titkot rejteget. Úgy tűnik, a játékok élethű grafikájának rendereléséhez használt grafikus feldolgozó egységek (Graphics Processing Units, GPU-k) segítségével felgyorsulnak az ezirányú vizsgálódások. Legalábbis a Harvard Cox és az MIT DiCarlo Laboratóriumának néhány kutatója szerint, akik közösen jegyzett munkában fejtették ki véleményüket.

A sokszázmillió feldolgozó egységet tartalmazó biológiai látórendszer visszafejtése és ugyanúgy működő mesterséges hasonmás létrehozása rendkívül kemény feladat. Kolosszális számítási kapacitások felhalmozása önmagában nem elég hozzá. Ki kell találni, hogy az összes rész miként kapcsolódik egymáshoz, majd a kapcsolódásokat gépi környezetben kell utánozni, máskülönben a mesterséges rendszer soha nem fog úgy működni, olyanokat tenni, mint az emberi agy.

Szerencsés gépmodellek

Az emberi agy tanulmányozásával sok kritikus információhoz jutottunk huzalozásának mikéntjéről, ám még ezek az információk sem elegendők ugyanúgy vagy hasonlóan funkcionáló számítógépes rendszer létrehozásához. A kísérleti idegtudomány felfedezései komoly segítséget nyújtanak, de még így is hihetetlen mennyiségű potenciális modellt kell feltérképezni.

A probléma kezeléséhez a kutatók a genetika és a molekuláris biológia screening technikájából, az érdeklődésre számot tartó fenotípussal rendelkező egyed (organizmusok sokaságából történő) beazonosítását és kiválasztását tesztelő módszerből merítettek ihletet. Egyetlen modell kidolgozása és a modell vizuális tárgyfelismerési képességének vizsgálata helyett, több ezer lehetséges modellt hoztak létre, majd kiválasztották a tárgyfelismerési feladat legjobbjait.

A szerencsések jobban teljesítettek, mint a mai csúcstechnológiát jelentő gépilátásrendszerek. Különböző tesztek sorozatait végezték el velük: véletlenszerűen kiválasztott természetes hátterekkel, változatos pozíciókban, elmozgatva, egyedül vagy több darabban láthatták a tárgyakat.

Besegít a játékhardver

Számítógépek átlagos feldolgozó egységével hosszú évekig eltartana, és dollármilliókba kerülne a megfelelő fejlesztőrendszer kidolgozása. Itt jön képbe a játékhardver – a kutatók konklúziója: egy hét fejlesztés, sokkal kevesebb pénz.

„A GPU-k valóban megváltoztatják a tudományos számításokat” – elmélkedik Nicholas Pinto (MIT). „Hatékony párhuzamos rendszert hoztunk létre boltokban beszerezhető olcsó komponensekből. Több százszor gyorsabb a hagyományos megoldásoknál. Ezzel a számítási kapacitással olyan új látásmodelleket tudunk felfedezni, amelyek elkerülik az eddig használatban lévők figyelmét.”

A megközelítés alapján létrehozott rendszereket a gépi látás különböző területein alkalmazhatják majd: arcazonosítás, gesztusfelismerés, tárgykövetés, gyalogosok detektálása. Ráadásul az emberi agyműködés megértésében is hasznunkra lehetnek: ha tudjuk, mely komponens hogyan kapcsolódik egy másikhoz, harmadikhoz, és így tovább, s ennek következtében jól működik a mesterséges rendszer, gyarapodni fognak saját, természetes rendszerünkre vonatkozó ismereteink is.

Az agy visszafelé és előretervezése önmagába visszatérő ciklus: minél többet tanulunk meg az egyikről, annál többet tudunk meg a másikról.

Index Vakbarát Hírportál

A holnap látógépei

Szerencsés gépmodellek

Besegít a játékhardver

Rovatok