Index Vakbarát Hírportál

Kép helyett verset készít az intelligens kamera

2024. április 21., vasárnap 11:21

A mesterséges intelligencia és a művészet találkozása – kicsit kizökkent a technika folyamatos fejlődésének megszokott kerékvágásából és visszavezet egy archaikusabb médiumhoz: az írott szöveghez.

Poetry Camera (Költeménykamera) néven újító elektronikai eszközt épített két mesterséges intelligenciára szakosodott amerikai hobbista tervező, Kelin Carolyn Zhang és Ryan Mather.

A hétköznapi kézi fényképezőgépekhez hasonló szerkezet képalkotás és rögzítés helyett szalagot nyomtat, amelyen versben írja le az elé táruló látványt.

A program akkor kezdődött, amikor hozzáférést kaptam a GPT-3-hoz. Első gondolatom az volt, hogy Dungeons & Dragonst játszom vele, mivel kocka vagyok

– meséli Ryan Mather a TechCrunch beszámolója szerint.

Működött is, de közben volt egy másik ötletem, hogy készítek egy kamerát. Mi lenne, ha lenne egy kamerám, amely az Instagram-kultúrára reagál és kép helyett szöveg jönne ki belőle... Mindenki azt mondja, hogy jobb a könyv, mint a film, akkor mi lenne, ha így örökítenénk meg a pillanatokat?

– tette hozzá.

Amikor sikerült megvalósítani a dolgot, kiderült, hogy az alkotó spekulációja nem volt alaptalan: a verselő kamera minden társaságot felvillanyozott. Az eszköz szíve egy Raspberry Pi mikroszámítógép, amely a beérkező képet gépi látással elemzi, majd a képen látható elemeket, mintákat és színeket prompttá alakítva küldi tovább a GPT-4 nyelvi modellhez, ahonnan versként érkezik vissza a kamerába épített mini nyomtatóba.

A technika és művészet mezsgyéjén lavírozó eszköz kész példányai a tervezőktől megrendelhetők, akik viszont nem tudták/akarták követni a keresletet. Aki biztosan szeretne ilyet, és van egy kis ezermesteri hajlama, letöltheti a nyílt forrású leírást a GitHubról, és maga építheti meg a lírai fényképezőgépet.

A különleges kamera artisztikus megközelítése nem teljesen példátlan: ott van egyebek között a Paragraphica, ami egy optika nélküli MI-fényképezőgép, avagy a mobiltelefonokat kiváltó Humane AI Pin, ami egy projektorral egybeépített, kitűző méretű kommunikációs eszköz. Annak ellenére, hogy ezek az amatőrségből csak félig-meddig kilépő megoldások, afelé mutatnak, hogy a mesterséges intelligencia képességeire építve teljesen más dimenziókban folytatódhat a fejlődés, mint amit a technika eddigi evolúciója alapján feltételeznénk.

Rovatok