Felelősségtudat, transzparencia, társadalmi haszon, valódi problémák megoldása.
Nagyjából ezekkel a méltóságteljesen unalmas címszavakkal lehet összefoglalni, milyen képet igyekezett festeni magáról a Google a hét közepén tartott amszterdami rendezvényén – miközben a nagy komolykodás közepette azért beszélgető mobilokból és a gondolatainkat is kitaláló lakásokból se volt hiány.
A cég júliusban nyitott új központot a városban a mesterséges intelligenciával (MI) kapcsolatos kutatásainak, itt gyűltek össze az újságírók mellett európai és afrikai döntéshozók, iparági képviselők és kutatók, hogy bepillantást nyerjenek abba, mi mindenbe pakolja bele a Google az MI-vel kapcsolatos fejlesztéseit.
A fent említett kettősség végig jellemző volt, a csillivilli okoskütyük fejlesztői váltogatták egymást a betegségek diagnosztizálására szakosodott kutatókkal vagy éppen a civil szervezeteket ösztöndíjakkal támogató Google.org képviselőivel. Többször elhangzott, hogy a Google nem önmagáért fejlesztget menő technológiákat, hanem hogy való világbeli problémákra találjanak valóban használható megoldásokat (üdvözlendő öniróniával még a Google Glass intő ellenpéldája is előkerült). De hogy kinek mi számít valódi problémának, az persze elég változó, az esőerdők fáinak illegális kivágásától odáig, hogy kézzel kell lekapcsolni a villanyt.
Érdemes már az elején tisztázni, hogy egyáltalán miféle technológiáról is van szó. A “mesterséges intelligencia” ugyanis sok mindent jelenthet, nem egyetlen konkrét módszert. Az utóbbi években azonban a legfontosabb és leglátványosabb eredményeket az úgynevezett gépi tanulás terén érték el a kutatók. Ennek az a lényege, hogy egy rendszert nem manuálisan programoznak be valamilyen konkrét feladatra, hanem sok-sok adattal tréningezik, hogy magától fejlődjön: képeket mutogatnak neki, hogy jobban felismerje, mi van a fotóinkon, szövegekkel etetik, hogy pontosabban tudjon fordítani és hasonlók. Erről itt írtunk részletesebben.
Mivel ma a gépi tanulás teszi ki az MI-fejlesztések zömét, a köznyelvben gyakran szinonimaként használják a kettőt, illetve leginkább az előbbit értik az utóbbin is. Ettől még persze ezek a gépek messze vannak attól, hogy valóban intelligensek legyenek, inkább bizonyos feladatok ügyes automatizálásáról van szó. Emiatt sokan szoktak fanyalogni, hogy a fejlesztőcégek manapság mindenre, ami árammal megy, ráfogják, hogy mesterséges intelligencia hajtja, miközben buta, mint egy írógép. Pedig ha tetszik, ha nem, ezeknek a fejlesztéseknek ez a mára elterjedt neve. Épp ezért szokták a még mindig csak sci-fikben létező, valóban intelligens gépeket “erős MI” vagy “mesterséges általános intelligencia” neveken megkülönböztetni. (A gépi intelligencia problémáiról itt és itt olvashatnak bővebben.)
A Google szakértői a rendezvényen sokat beszéltek arról, milyen kihívásokkal kell megbirkózniuk a fejlesztés során, illetve milyen korlátai vannak a gépi tanulásnak, amelyeket feszegetni igyekeznek. A technikai részletekkel nem untatnám az olvasót, de a kutatók olyasmiken dolgoznak, hogy hogyan lehet minél jobb minőségű adatokkal edzeni a rendszereket; minél gyorsabban megtalálni az egyes feladatokhoz leginkább passzoló rendszerfelépítést; minél kevesebb előfeldolgozással ráereszteni a rendszereket az adatokra; minél hatékonyabb algoritmusokat írni, hogy a gyengébb telefonokon helyben is elfussanak; illetve hogyan lehet egy kis kreativitást csempészni a modelleket szolgaian másoló gépek működésébe.
A Google az utóbbi években mindent az MI-re tett fel, az összes fontos termékét és szolgáltatását e köré szervezi és ezzel próbálja eladni. (Ez persze nem csak rájuk jellemző, a nagy riválisok eszközei, mint az iPhone XS vagy a Huawei Mate 20 Pro, szintén az MI-re vannak kihegyezve.)
A szoftverrel feszegetjük a hardver határait, majd az MI-vel lépjük át ezeket a határokat
– mondta például az új Pixel 3 telefonokról Jose Ricardo Lima, aki saját készítésű képeken mutatta be, milyen szuperül lehet fotózni a különféle intelligens funkciók segítségével, ezért az a vicces helyzet állt elő, hogy a saját fotóit dicsérte agyon a színpadon.
A Pixel 3 egyébként tényleg egy sor okos trükkre képes, például több hasonló csoportképből legóz össze egy olyat, amin mindenki jól néz ki; vagy szól, ha koszos a lencse, nehogy emiatt homályos fotókat lőjünk. Bejövő hívásnál egy gombnyomással rákérdez a hívónál, mit akar, és ezt még a hívás felvétele előtt kiírja nekünk a kijelzőre, hogy eldönthessük, tényleg akarunk-e beszélni az illetővel. Az Asszisztens mindenféle szóban feltett kérdésünkre válaszol arról, hogy milyen lesz holnap az idő, merre van a legközelebbi kisállat-kereskedés vagy hány éves a holland király. A Google Lens a kamerán keresztül azonosítja, milyen fajta a szomszéd cuki kutyája; megmondja, épp milyen híres épület mellett mentünk el; segít megvenni egy lefényképezett könyvet vagy ruhát; vagy pötyögés nélkül felhívja a nyomtatott névjegykártyáról leolvasott számot.
Aztán persze más kérdés, hogy mindebből az okosságból mennyi és hogyan működik a gyakorlatban. A Google központjának legfelső emeletét például arra rendezték be, hogy mindenféle intelligens trükköt kipróbálhassunk rajta, és a szervezők előre szóltak is, hogy ehhez milyen appokat telepítsünk – csakhogy a négyből kettő vagy sok telefonra nem is érhető el, vagy nem működik magyarul. Aztán amikor kölcsön kaptam egy Pixelt, hogy mégiscsak kipróbálhassam a Google Lenst, az egy windowsos kék halált is megszégyenítő makacssággal tagadta meg az együttműködést, hiába mutogattam neki türelmesen Van Gogh önarcképét, hogy ugyan mondja már meg intelligensen, hogy az Van Gogh önarcképe.
Sajnos a Fordító app legmenőbb funkciója se tud még magyarul, amely a kamera képén élőben kicseréli egy felirat szövegét másik nyelvre. (Pontosabban nem minden nyelvről tud magyarra fordítani, így például hollandról se.) A beszéd valós idejű írásos tolmácsolása viszont elérhető, sőt egészen szépen megbirkózik a magyarral, úgyhogy simán tudtam magyarul társalogni egy törökül beszélő Google-alkalmazottal, miután még angolul túllendültünk a nyitópoénján. (“Magyarországról jöttél? Akkor tudsz is kicsit törökül, ugye?”)
Aztán a dizájnmálló vakolat és a lakossági indusztriál látszócsövek között elbotorkáltam még a Lens appal épp egymás cipőmárkáját felismertető kollégák mellett. A gendersemleges vécénél elugrottam egy nő elől, aki váratlanul az arcomba tolta a telefonját, mert épp egy emojivadász appal játszott, és azt a feladatot kapta, hogy keressen egy szemüveget, amit a fejemen talált meg. Egy csirkeszoborral díszített ebédlőasztalnál valaki épp lasagne-receptek után érdeklődött a Google Home Hubnál. Egy sarokban pedig egy webkamera előtt táncikálva lehetett csekkolni, a Google mozgáselemzője szerint ki ugrabugrál még hozzánk hasonlóan, de ezt nem próbáltam ki, mert bár elég sok volt a környéken a mesterséges intelligencia, azért próbáltam a saját eszemet se elveszíteni.
Később alkalmunk nyílt meglátogatni a Google által egy amszterdami lakóépületben berendezett, pár hete nyílt okoslakást is. Itt minden össze van kötve mindennel, és a lámpáktól a termosztáton át a tévéig az egész okosotthont a hangvezérlésű Asszisztens irányítja, pontosabban rajta keresztül a kedves felhasználó. A bemutató itt se ment zökkenőmentesen, de a végére azért még így is eléggé irigykedtem azokra, akiknél már elérhető az ilyesmi. (A lakást demózó Google-ös srác büszkén mondta, hogy egyre több nyelvre terjesztik ki ezeket a szolgáltatásokat, de amikor megkérdeztem, hogy a magyarhoz mikor érnek oda, csak széttárta a kezét.)
Oké, anélkül megvagyok, hogy a Google Home-ot kérjem meg a lámpa felkapcsolására, mert mindennek van határa, nekem meg két kezem. Az viszont a mindennapokban elég kényelmes lehet, hogy önmagukban egyszerű, de sok időigényes kis lépésből álló feladatokat lehet egy félmondattal elintézni. A “Hey Google, indítsd el a Stranger Thingst” varázsigéből a rendszer például tudta, hogy ezt melyik mikrofonba mondtuk, azzal melyik tévé van egy helyiségben, tehát ott kell elindítani a sorozatot, aminek ez a címe, a Netflixről érhető el, és attól a ponttól kell lejátszani, ahol legutóbb abbahagytuk.
Az Asszisztens persze még mindig nem tud csak úgy társalogni, mint A nő című filmben a Scarlett Johansson-hangú kollégája, mert ahhoz nagyon buta, de arra már egy ideje képes, hogy az egymás után elhangzó kérdésekből értelmezze a kontextust: ha megkérdezzük, hogy milyen idő lesz holnap Debrecenben, aztán azt, hogy hogy lehet eljutni oda, akkor tudni fogja, hogy még mindig Debrecenről beszélünk, legalábbis ha angolul tesszük.
A Google mellett természetesen az összes többi nagy techcég is intenzíven kutatja-fejleszti a mesterséges intelligenciát. A Google egyik helyzeti előnye, hogy a gépi tanuláshoz adat kell, méghozzá rengeteg, márpedig abból ők elég jól állnak – de ugyanebből az okból éri őket rengeteg kritika is a felhasználói adatokra építő üzleti modelljük miatt. Ezt nyilván a cégnél is tudják, nem véletlen például, hogy a Pixelek fotótudását bemutató Lima külön kiemelte, hogy a kamerafunkciók fejlesztéséhez nem használják fel az emberek privát képeit, csak nyilvános fotókat.
És részben ugyanezért jöhetett létre egy külön csapat a cégen belül, amelynek kifejezetten az a dolga, hogy gondoskodjon a “felelősségteljes MI-ről”, a Google-ös fejlesztések etikusságáról, állítólag akár az üzleti érdekekkel is szembemenve.
Az etikai csapat fő műve egy alapelveket összefoglaló lista, amely gyakorlatilag a Google MI-fejlesztési alkotmánya. Ez hét célból és négy önkorlátozó tiltásból áll. A célok olyasmiket mondanak ki, mint hogy a fejlesztéseknek társadalmilag hasznosnak kell lenniük, törekedniük kell az előítéletes torzítások elkerülésére, biztonságosnak, elszámoltathatónak és magas tudományos színvonalúnak kell lenniük, tiszteletben kell tartaniuk a magánszférát, illetve elérhetőnek kell lenniük mindenkinek, akik ezen elvek menték akarják használni őket. A tiltások pedig kimondják, hogy a cég nem fejleszt olyasmit, ami fegyverként használható vagy más módon veszélyt jelent másokra, törvénytelen megfigyelésre alkalmas vagy emberi jogokat sért.
Ezeket alapelveket idén júniusban tették közzé, nem sokkal azután, hogy elég nagy botrány kavart, hogy többen felmondtak, amiért a cég részt vett a Project Maven nevű katonai fejlesztésben.
Azt Jen Gennai, az etikai csapat vezetője is elismerte, hogy a Mavennek szerepe volt az alapelvek publikálásában, de az Indexnek azt mondta, hogy a botrány csak az időzítésbe szólt bele, mert magukon az elveken addigra már több mint egy éve dolgoztak, miután a cégvezér Sundar Pichai a tavaly májusi I/O fejlesztői konferencián bejelentette, hogy a Google-nél az MI az első. Csak amolyan megfontolt kutatói tempóban haladtak, előbb mindegyik alapelv tíz oldalas volt, aztán leszorították négy oldalra, majd amikor beütött a Maven, szóltak nekik, hogy menjenek le kettő mondatra, mégpedig igen gyorsan, mert elég aktuálissá vált a dolog.
Gennai szerint éppen az jelenti a garanciát arra, hogy a jövőben nem futnak bele hasonlóba, hogy transzparensek, kitették az ablakba, mit vallanak, és innentől ezeket számon is lehet rajtuk kérni, amihez mindenféle külső szervezetekkel is együttműködnek. Sokan mégis elégedetlenek ezekkel az elvekkel, mert azok a kritikák szerint kellően tágak és homályosak ahhoz, hogy a gyakorlatban ne jelentsenek túl sokat.
Annyi mindenesetre biztos, hogy Gennai csapatának valamennyi beleszólása tényleg van abba, milyen projekt valósulhat meg, mert a másik nagy figyelmet kapott katonai projekttől, a Jeditól már etikai megfontolásból léptek vissza. (Persze a Maven után pr-szempontból se jöhetett rosszul ez a lépés.) Több más projektet is leállítottak vagy visszadobtak módosításra, de ezeket Gennai nem akarta elárulni. Arra a kérdésre viszont, hogy van-e olyan projekt, amely még az ő ténykedésük előtt indult, de ha már működtek volna, beleszóltak volna, a Maven mellett a Dragonfly kódnevű cenzúrázott kínai keresőt említette.
Az alapelvek között szerepel a torzítások kiküszöbölése is. Ez magyarul azt jelenti, hogy meg akarják akadályozni, hogy a társadalmi előítéletek, a faji, nemi, vallási vagy más diszkrimináció, átöröklődjenek az MI döntéseibe, például a tanításához felhasznált adatokból – ahogy az történt mondjuk a feketéket gorillának néző Google Fotók vagy a nőket a konyhába kényszerítő Google Fordító esetében (és egy sor másik cég szolgáltatásainál is). Gennai szerint nemcsak arra kell figyelni, hogy a kezdeti forrásadatok nem legyenek elfogultak, hanem arra is, hogy miután élesedik a termék, az azután befutó adatokból se tanuljon el elfogultságot.
A szintén a közelmúltban alapított ghánai Google-kutatóközpontot vezető szenegáli Moustapha Cisse szerint ezek a torzítások nemcsak az adatok szintjén, de a fejlesztési folyamat más pontjain, például az algoritmusok felépítésében vagy a mérnökök értékrendjén keresztül is beszűrődhetnek a rendszerbe. Ráadásul ezeknek a beépített előítéleteknek már a forrását se mindig könnyű azonosítani. Elmesélt egy példát, amikor egy képkategorizáló algoritmus fura torzítást produkált: minden kosárlabdás keresésre fekete kosarast dobott fel, holott a fejlesztők által használt adatbázis összeállítói kifejezetten figyeltek arra, hogy abban fehér kosarasok is legyenek. Végül kiderült, hogy ez ugyan igaz, viszont az adatbázisban kizárólag kosarasként szerepelt fekete férfi, így akaratlanul is torzultak a kosárlabdás keresési eredmények.
Az alapelvek szép szavain túl azért a Google konkrét fejlesztői lépésekkel is igyekszik demonstrálni a társadalmi hasznosságát. Ilyenek például az izraeli központjukban készülő kríziskezelő szolgáltatások. Egyrészt ha valaki olyan helyre keres, ahol épp valamilyen válsághelyzet van, a Google értesíti erről. Másrészt állami szervek is adhatnak ki közérdekű közleményeket a Google segítségével. Harmadrészt ennél közvetlenebbül is próbálnak segíteni, például az árvizek előrejelzésével gépi tanulásos modellek segítségével, hogy figyelmeztetést küldhessenek a veszélyeztetett területen élőknek. Ez a kísérleti program már működik Észak-Indiában.
De a legígéretesebb terület, ahol a Google – más techcégekhez, például az IBM-hez vagy a Microsofthoz hasonlóan – valódi problémákon dolgozik MI segítségével, az egészségügy.
A cég egészségügyi fejlesztéseit vezető Katherine Chou szerint egyrészt azon próbálnak segíteni, hogy a még mindig nagyon széttagozódó, elaprózott egészségügyi adatokat lehessen rendszerezni, összekapcsolni és könnyebben kezelni. Másrészt a diagnosztikában támogatják az orvosokat olyan feladatok átvállalásával, amelyek tipikusan időigényesek, pedig viszonylag könnyen automatizálhatók, mint a röntgenfelvételek elemzése. De a cél nem az emberi munkaerő, vagyis az orvosok lecserélése, hanem éppen a felszabadításuk, hogy több idejük legyen konkrétan a betegekkel foglalkozni. Moustapha Cisse szerint egyébként is tipikusan első világbeli probléma, hogy az MI elveszi-e az orvosok munkáját, mert Afrikában például sok helyen nincs is elég szakember, akitől el lehetne venni, ezeken a helyeken segíthet különösen sokat a gépi megoldások.
Az egyik olyan terület, ahol a képelemző technológiát sikeresen alkalmazzák, a diabéteszes retinopátia azonosítása. Ez a leggyorsabban növekvő megelőzhető vaksági ok, és a felmérések alapján a gépek pontosabb diagnózist tudnak adni róla, mint az orvosok. Chou szerint viszont a legutóbbi kutatásaik azt mutatják, hogy az MI és az emberi szakértő közös munkája a leghatékonyabb például a mellrák diagnosztizálásában, együtt nemcsak az embernél, de az önálló gépnél is jobb eredményt értek el.
Ezek szép eredmények, de a Google egészségügyi megoldásai még fiatalok. A cég előélete miatt kérdés, hogy a különösen érzékeny egészségügyi adatok kezelése terén lesz-e feléjük kellő bizalom ahhoz, hogy jobban elterjedhessenek majd ezek a szolgáltatások.
A saját fejlesztések mellett a Google filantróp részlege, a Google.org független szervezetek munkáját is támogatja társadalmi-környezeti problémák megoldásában – ez inspirálta egyébként a rendezvény díszletét is, de amíg ez kiderült, addig elég sok értetlenkedő arcot lehetett látni a folyosóra elhelyezett műpapagájok és a színpad mögötti esőerdő körül.
Néhány példa:
A Google.org a múlt héten jelentett be egy új pályázatot, a Google AI Impact Challenge-et. Civil szervezetek pályázhatnak, de nem proof-of-concepteket, hanem a gyakorlatban is működő, valódi hasznot hozó MI-projekteket várnak. A pályázat össztámogatása 25 millió dollár (7 milliárd forint), emellett eszközökkel és tanácsadással is segítik a nyerteseket. Január 22-ig bárki jelentkezhet, úgyhogy ha önnek van egy mesterséges intelligenciát is hasznosító világmegváltó ötlete, erre tessék.
Munkatársunk a Google meghívására és költségén vett részt a rendezvényen. A cikk enélkül nem készülhetett volna el, ugyanakkor teljes egészében szerkesztőségi tartalom, készítésére a cég semmilyen befolyással nem volt.
(Borítókép: Bolcsó Dániel / Index)