Index Vakbarát Hírportál

Épp csak megérkezett, máris vége is az új sztárszakmának

2024. március 13., szerda 06:07

Az ember soha nem tud úgy utasítást optimalizálni, mint a gép maga. A prompt tervezés azért nem szakma, mert egy segédprogrammal kiváltható. Szakértő mesterségesintelligencia-kezelőkre ettől függetlenül a jövőben is szükség lesz.

Amióta a Dall-E és a ChatGPT megérkeztek, a cégek egy sor feladatot bízhatnak a mesterséges intelligenciára. A gépek marketinganyagokat, képeket és szövegeket generálnak, automatikusan válaszolnak, és asszisztensi feladatokat is elvégeznek, csak kell valaki, aki eléri náluk, hogy ne hazudjanak, vagy ne rajzoljanak például furcsa és torz kezeket.

Aki ezt megoldja, prompt tervezőnek nevezik. Ő az ember, aki ismeri a mesterséges intelligencia kezelésének titkait, tudja, hogyan kell hatékony szóbeli utasításokat megfogalmazni, trükköket, beállítható paramétereket, sőt akár olyan hackeket, amikkel a beépített korlátokat is átugorja a gépi elme.

A mesterséges intelligencia forradalmi változás, és a prompt tervező az utóbbi évek új sztárszakmája, amivel mérnöki pénzeket lehet keresni mérnöki képzettség vagy képességek nélkül. Aki felszállt volna erre a hajóra, de mégsem tette, valószínűleg megnyugvással veszi tudomásul, hogy ez a szakma, amilyen gyorsan jött, olyan gyorsan búcsúzik is. Igaz, nem vész el, csak átalakul, miközben a szerepének nagy részét maga a mesterséges intelligencia vagy a nyelvi modellek veszik át.

Igenis, kapitány!

A kaliforniai VMware munkatársai, Rick Battle és Teja Gollapudi meglepőnek találták, hogy milyen zűrösek lehetnek egy megadott prompt következményei. Ha matematikai vagy logikai kérdést kell megoldani, az MI jobb eredményt produkál, ha megkérik, hogy lépésről lépésre írja le a gondolatmenetét. Szintén jobb eredményt kaptak, ha promptba beleírták, hogy „ez jó lesz” vagy 

„olyan okos vagy, mint a ChatGPT”.

A két szakember a nyomot követve általános iskolás matekpéldákon kezdte tesztelni a promptolási stratégiákat. 60 különböző utasításkombinációt próbáltak ki három nyelvi modellen. Az eredmény a konzisztencia teljes hiánya volt: a gondolatmenet kiíratása, ami egyszer javította a teljesítményt, máskor visszavetette azt.

Battle és Gollapudi kutatása megállapította, hogy a gép által generált promptok jobb eredményt produkáltak, és napokig tartó kísérletezés helyett órák alatt megoldották a feladatot.

Az optimális promptok bizarrak voltak, amilyet egy ember sosem írna. Az egyik esetben például a Star Trek sorozat stílusát vette fel, és az elemi matekfeladat megoldásához Kirk kapitányként megszólalva kérte, hogy tervezzenek pályát az űrhajó előtti turbulencián való átkeléshez. Battle szerint a promptok optimalizálásának lényege, hogy a nyelvi modellek tényleg modellek.

Sokan antropomorfizálják ezeket, mondván, hogy beszél angolul. Nem beszél. Nem tud angolul, hanem nagyon sokat matekozik

– mutatott rá a szakember.

Battle szerint 

felesleges és értelmetlen, hogy emberek a promptok optimalizálásával próbálkozzanak,

a nyelvi modell megalkotja az optimális promptot, ha megkérik rá, és ezt akár automatizálni is lehet újonnan fejlesztett eszközökkel.

Ülsz és próbálod kitalálni a szavak legjobb eredményre vezető mágikus kombinációját. A kutatásunkból kiderül, hogy kár a gőzért. Csak kell egy rendszer, ami alapján meg tudjuk mondani, hogy az egyik prompt jobb eredményt adott, mint a másik, és a modell magától optimalizálni fogja

– mondta.

Mesterségem címere

A képgenerátoroknál hasonló a helyzet. Az Intel Labs munkatársa a Vasudev Lal a Stable Diffusion képgenerátor promptjait vizsgálta.

Úgy tűnik, hogy ez a szakértő prompttervezés nem funkció, hanem inkább hiba a nagy nyelvi modellekben. Meg szerettük volna nézni, hogy automatizálható-e

– mondja Lal, aki csapatával NeuroPrompts néven olyan eszközt fejlesztett, ami a legegyszerűbb promptból jó minőségű képeket generál az emberi szakértők által is használt speciális promptparaméterek hozzáadásával. A különböző stilisztikai jellemzőket a laikus felhasználók is kiválaszthatták. A generált képeket az esztétikai minőségét bíráló PickScore nevű alkalmazással mérték.

A végeredmény itt is ugyanaz lett: a mesterséges intelligencia által generált promptok jobbak voltak, mint amit a „mérnökök” próba szerencse alapon kitaláltak.

Új idők váltják a régit

A prompt tervezőknek azonban nem kell aggódniuk, szakmájuk más formában és más néven biztosan megmarad.

Elég sokáig lesznek még prompt tervezők és adattudósok. Ez nem csak arról szól, hogy kérdéseket teszünk fel a nyelvi modellnek és gondoskodunk róla, hogy jó legyen a válasz. Egy sor olyan dolog van, amit egy prompt tervezőnek meg kell tudni oldania

– mutat rá Tim Cramer a Red Hat szoftvertervezési igazgatója.

A nagy cégek által használt nyelvi modelleknek nagyon különböző körülmények között is helyt kell állniuk, amihez nagyon sok felhasználási eset tartozik. Ezek megbízható kezelésére mára új munkakörök létesültek: az LLMO, vagyis a nagy nyelvi modell operátor, vagy MLO, gépi tanulási operátor. Ezeknél a promptolás csak egy feladat, de a technika változása miatt a munkakörök is folyamatosan változnak, ahogy a szerepek kategóriája és megnevezése is.

(Spectrum IEEE

(Borítókép:  Graham Hughes / Bloomberg / Getty Images)

Rovatok