Index Vakbarát Hírportál

Nálunk készül a jó szándékú kémszoftver

2013. február 12., kedd 11:40

Sok a kérdés és a kidolgozandó részlet, de a tavaly decemberben indult, és mostanában lendületbe jövő, FuturICT nevű program az egyik legnagyobb hatású projekt lehet, ami európai szinten a jövő jobbá tétele miatt indult. A tízéves programból magyar kutatók is kiveszik a részüket, a két évig másfél milliárd forintból működő magyar tömörülés dolga az alapok kidolgozása. Hogy mire lesz jó az egész, az még kicsit ködös.

Egy most induló európai szintű összefogás célja egy olyan rendszer kialakítása, ami az adatok valós idejű kiértékelésével képes arra, hogy egy lépéssel a valóság előtt járjon. A jövőt ugyan nem mondja meg, de figyelmeztethet katasztrófa, baleset, járvány vagy pénzügyi csőd előtt, méghozzá akkor, amikor még lehet esély a megelőzésre vagy a megoldásra. Hangzatos cél, amiből talán tíz év múlva lehet valami, az építőköveket azonban már elkezdték összehordani a résztvevő országok.

A projekt magyar kollektíváját négy cég száz embere alkotja, akik azon dolgoznak, hogy milyen eszközökkel és módszerekkel lehet annyi adatot összegyűjteni, ami egy ilyen rendszer működéséhez kell. Az alapötlet már megvan, a lassan általánossá váló okostelefonok gyűjtik és dolgozzák fel a körülöttünk lévő világból kapott információkat. Nem nagy nóvum ez, a Facebook és a Google évek óta abból él, hogy minket figyel, az Európai Unió FuturICT nevű programja viszont a köz javát szolgálná. Az etikai és jogi problémák megoldásán túl is van feladat, például nem árt majd kitalálni egy olyan munkamódszert, ami mentén ez a hatalmas, szerteágazó, több tucat országot, céget és több ezer embert igénylő feladat megvalósulhat.

Minden hálózat

Az adat lehet a 21. század olaja. A mindenki által használt rendszerek folyamatosan gyűjtik az információkat: mit vásárlunk, mit szeretnénk elolvasni, mivel próbáljuk gyógyítani az influenzát, és akár azt is, hogy mikor kapcsoljuk fel a villanyt. Ezt a hatalmas értéket eddig jórészt csak üzleti célokra használták azok a cégek, akik hozzáfértek, a FuturICT ezen változtatna. A projekt magyar programja, a FuturICT.hu koordinátora, a Szegedi Egyetem Mesterséges Intelligencia Kutatócsoportjában dolgozó Jelasity Márk szerint a hazai résztvevők előtt álló két év egyik legfontosabb feladata az, hogy egy olyan alapinfrastruktúrát dolgozzanak ki, amiben lehetővé válik az adatok összegyűjtése és megfelelő kiértékelése, hogy aztán az így kapott eredményekkel a tudományos, a szociális, a politikai vagy a gazdasági problémákon tudjanak segíteni.

Az alapötletet az a felismerés adja, hogy manapság minden fontosabb rendszer leírható hálózatként. A közösségi oldalakon emberek hálózatáról van szó, a közlekedésben a járművekéről, a tőzsdén a pénzpiaci történések kapcsolatrendszerét látjuk, de akár maga a tudomány fejlődése is leírható a tudósok egymás munkájára épülő hálózataként, hogy a Föld klímáját vagy az ökoszisztéma fajainak egymásra utaltságát ne is említsük. A fő motiváció az, hogy az ilyen hálózatok működését minél jobban megismerjük, méghozzá elsősorban a hálózat résztvevőinek adatait felhasználva, felismerve az ezek közti összefüggéséket. A FuturICT tehát egy olyan adatgyűjtő és -feldolgozó rendszert szeretne, amivel a jövő ugyan nem válik megjósolhatóvá, de könnyebben felmérhetővé válik egy-egy döntés vagy történés előzetes felmérése.

Az indulás azonban elég rögös: az Európai Unió január 28-i döntésével kiderült, hogy a program nem kerül be az úgynevezett Flagship, vagyis kiemelt támogatású projektek közé. Jelasity szerint ez a kétéves magyar projektet nem fenyegeti, az Európai Szociális Alapból, tehát európai forrásból származó, de magyar pályázaton elnyert pénznek nem volt feltétele, hogy a FuturICT flagship programmá váljon. „Az tény, hogy most még kérdés, két év múlva lesz-e még FuturICT. Az biztos, hogy a projektre illek a too big to lose angol kifejezés, vagyis hogy túl sok ember túl sok munkája van ahhoz ebben, hogy egyszerűen csak eltűnjön. Most épp azon vagyunk, hogy valamilyen formában együtt maradjon ez az egész, bár az egyik vezető már kiszáltt a projektből.” A szegedi szakember szerint fontos, hogy a hálózatkutatás (részben a FuturICT kezdeményezésnek köszönhetően) kutatási területként megvetette a lábát, viszont a jövőben valószínűleg nem kap akkora hangsúlyt, mint egy kedvezőbb EU-s döntés esetén kapott volna. „Érdekes, hogy európai kutatásnak indult, de egyre több az érdeklődő az USA-ban és Ázsiában is”, teszi hozzá Jelasity, aki nem szeretne tippelni azt illetően, hogy pontosan milyen lehetőség lesz a magyar program eredményeinek felhasználására.

Az adat ott van, csak érte kell nyúlni

Alapvető kérdés, hogy pontosan honnan is szerzi majd a FuturICT a feldolgozandó adatokat, a modellek felépítéséhez és vizsgálatához ugyanis adat kell, méghozzá sok. Nagy szerencse, hogy a 2007 környékén, az okostelefonok és a közösségi oldalak megjelenésével, illetve népszerűvé válásával elindult kommunikációs forradalom tökéletes alapanyagot nyújt ehhez. A feladat tehát az, hogy valahogy a projekt kihasítson egy részt ebből a tortából. Jelasity csoportja két irányban indul el. Egyrészt ott a Twitter, mint a legnagyobb, jórészt szabadon elérhető adatokkal dolgozó közösségi hálózat. Másrészt viszont az okostelefonok által forgalmazott adatok egy részének megszerzése a cél, és ez jelenti a nagyobb feladatot.

Első hallásra például azt gondolnánk, hogy felfoghatatlan méretű adatmennyiség összegyűjtéséről, tárolásáról és utólagos elemzéséről van szó. Jelasity szerint erről szó sincs. A munkacsoport elsődleges feladata egy olyan módszer kidolgozása, ami a telefonokon összegyűjtött adatokat nem küldi sehova. Ehelyett helyben, a telefon erőforrásait kihasználva elemzi azokat, és csak a nagyban finomított és rostált eredményeket küldi el a központnak. A pontos módszer egyelőre azonban még kiforratlan, ráadásul szembemegy minden jelenleg elfogadott eljárással. Az ilyen adatgyűjtő és -elemző projektek egy, vagy akár több nagy központi számítógéppel bányásszák a beérkező adatokat, ezt a munkát a felhasználó telefonjára bízni meglepő kiindulási pont.

„Igazából a FuturICT.hu célja pont az, hogy kidolgozzon és leteszteljen egy ilyen módszert” – árulja el Jelasity, aki szerint egyelőre nem a konkrét adatgyűjtő alkalmazások írása a legfontosabb feladat. A hálózatelmélet általános alkalmazásának fejlesztése mellett főleg egy olyan, középrétegnek nevezett platformot szeretnének kidolgozni, ami képes az alapvető adatműveletek végrehajtására, és egy olyan adatfeldolgozó eljárás is kell, ami a sok helyről származó, igazából sehol sem tárolt adatokat is kezelni tudja. Ha ez megvan, akkor lehet elgondolkozni azon, hogy mit és hogyan kell összegyűjteni.

Játszani is engedd

Sokan bele sem gondolnak, de nem csak a bankkártyaadataink, a pontos földrajzi helyzetünk vagy a levelezésünk van a telefonunkon. A szerkezet mozgásérzékelő és képfelvevő szenzoraival ennél sokkal közvetlenebb adatok is kinyerhetők, és Jelasity szerint már régóta léteznek olyan algoritmusok, amelyek ezeket elemezve pontosan megmondják, hogy mikor kapcsoljuk fel a villanyt, mikor utazunk vonaton, vagy épp milyen gyorsan lépünk séta közben.

Ahhoz azonban, hogy ebből bármi is legyen, két alapvető problémát kell leküzdeniük a szakembereknek. Az egyik, hogy a Google-nek, a Facebooknak, a Foursquare-nek, a Twitternek és a többi, sokmilliós felhasználói bázissal rendelkező alkalmazásnak ugyan boldogan, szinte gondolkodás nélkül átadjuk az összes adatunkat, ez nem jelenti azt, hogy mindezt akkor is megtennénk, ha nem éreznénk úgy, hogy kapunk is valamit cserébe. Jelasity is egyetértett abban, hogy az adatgyűjtés legnehezebb része az lesz, hogy valahogy rábírják a felhasználókat arra, hogy a jövőben kifejlesztett okostelefonos FuturICT-appokat ne csak letöltsék, de használják is.

„Mivel mi elsősorban matematikusok, és nem pr-szakértők vagyunk, ez a rész elég nagy kérdőjel egyelőre” – vallja be Jelasity. Az indulással nem lesz gond, a projekt költségvetéséből vásárolt száz darab okostelefont ugyanis a Szegedi Egyetem hallgatói között osztják majd ki, de a pontos alkalmazások még csak most körvonalazódnak. Egyelőre ötletelnek, felmerült például, hogy olyan véleménynyilvánító népszavazásokat tartó applikációt készítenek majd, amiben a felhasználó három-négy lehetséges válasz közül küldhet be egyet. Ez jó az adatgyűjtők szempontjából, hiszen a felmérés eredményei mellett megkapják a területi eloszlást, a válaszok nemekre vetített arányát, és a többi statisztikai szempontból fontos dolgot, érdekes kérdések esetén pedig a felhasználók is örülnek annak, hogy megismerhetik mások véleményét, illetve hogy láthatják, mennyire általános az ő válaszuk az adott kérdésben.

Adatvédelmi aggályok

Bár az emberek egy-egy szoftver telepítésekor csak a legritkább esetben olvassák el a felhasználás feltételeit, mostanában azért kiderül, hogy nem szeretjük, ha valaki látványosan pofátlanul turkál az adatainkban. Nem vagyunk oda a Facebookon megbokrosodó személyes posztokért sem, de hatalmas felháborodást kelt, ha egy programról kiderül, hogy folyamatosan rögzíti például azt, hol vagyunk éppen. Az Instagram nevű, példátlan sikert befutó fényképező-alkalmazás egy pillanat alatt 4 millió felhasználót vesztett el, mikor a tulajdonos bejelentette: az instagramos fotóink mostantól bármikor visszaköszönhetnek egy reklámból.

Jelasity szerint a FuturICT.hu tagjai pontosan tudják, hogy mind a jogi, mind az etikai előírásoknak és elvárásoknak meg kel felelniük. „Nem is olyan egyszerű ez, hiszen a jogrendszer sok esetben méretes késésben követi a technológiai lehetőségeket” – mondja a szakember. Elmondása alapján fontos, hogy a készítők egyensúlyra törekedjenek. Nem szabad túl intim dolgokat elkérni, nem szabad ezekből könnyen egyénesíthető következtetéseket levonni, és mindenképp úgy kell alakítani az adatsorokat, hogy azzal csak a FuturICT kezdhessen valamit, egy rosszindulatú adattolvaj ne. Az, hogy ez pontosan hogy lehet elérni, az a jogi előírásoknak való megfelelés mellett az egyik legfontosabb kérdése a hazai csapat kétéves projektjének.

Másfél milliárd forint, de mire is pontosan?

Ennyi pénz nem kevés, még akkor sem, ha a projekt teljes egészében a Európai Szociális Alap által finanszírozott TÁMOP-4.2.2.C-11/1/KONV-2012-0013 pályázat keretein belül valósul is meg. Figyelembe véve azonban, hogy az összeg négy résztvevő cég száz dolgozójának kétéves bérét, az alapvető architektúra, az eljárás és a különböző alkalmazások kifejlesztését jelenti, már finomodik a kép. De mégis, mire lehet használni ezt az egészet? Azt már tudjuk, hogy mi az eszköz: lehetőség szerint több millió ember speciálisan kiválogatott, az összefüggésekből kiragadva mit sem érő adattömege.

Jelasity szerint a hálózatkutatás egy felfelé ívelő tudományág, a pontos alkalmazási lehetőségek feltérképezése még a jövő feladata. Az azonban már most látszik, hogy a modelleket és az azokon futó szimulációkat nemcsak arra lehet használni, hogy a tudósok érdekes cikkeket írjanak a kirajzolódó összefüggésekből, hanem például arra is, hogy a most működő rendszereket hatékonyabbá, jobbá tegyük. Ha nem is lehetne előre látni a jövőt, nagyjából tudni lehetne, hogy egy-egy bevezetésre szánt törvény milyen reakciót váltana ki a társadalom bizonyos rétegeiből, rábukkanhatnánk néhány olyan egészségügyi összefüggésre, amit korábban még senki nem fedezett fel, és talán az adójogszabályok átalakítása is könnyebbé válna, hogy csak néhányat említsünk a tudományos, társadalmi vagy egészségügyi lehetőségek közül.

A felhasználás pontos módját előre megmondani nagy feladat. Egyrészt a projekt bevallottan bátor, sőt nagyravágyó célokkal indul, ahol az irány megadása fontosabb, mint a pontos célok meghatározása. Egyelőre azt lehet tudni, hogy a hálózatok kutatásával akár egy újabb gazdasági válság is megelőzhető lesz, de hogy ez valóban így van-e, csak akkor derül ki, ha a rendszer megépül. Ez talán úgy érthető meg a legjobban, ha a világegyetem nagy kérdéseit kutató Nagy Hadronütköztető megépítésével vonunk párhuzamot. Az is sokba került, ott is voltak elméletek, hogy mi történik a bekapcsolás után, de a pontos válaszok csak később kezdtek el összegyűlni.

Elméletileg lesz egy eszközünk, ami képes lesz meglátni az egymásra épülő folyamatok egyes lépéseinek veszélyeit, és bizonyos fokig modellezni tudja majd a következményeket. A távlati cél az, hogy valamilyen szinten lássuk egyes döntések hatásait azelőtt, hogy azok életbe lépnének. Az adójogszabályok optimalizálása, a feszült politikai helyzetek megoldása, közlekedési dugók elkerülése, időjárási előrejelzések pontosítása, korrupció, bűnözés visszaszorítása – csupa olyan dolog, ami csak pontosabbá válhat, ha bevezetünk egy rendszert, ami folyamatosan figyeli, mi történik az egyes emberek szintjén.

Azonban az idáig elvezető úton is lehet pozitív hatása a közben felfedezett adatkezelési, adatbányászati és kiértékelési megoldásoknak. Hatékonyabb keresőalgoritmusok gyorsíthatják a mindennapi számítástechnika fejlődését, a feljavított adatkezelési módszerek napi szinten javíthatnak a telefonjaink és egyéb IT-eszközeink sebességén, és egy ilyen szintű együttműködés egészen biztos, hogy teret adna korábban nem ismert vagy ki nem próbált kutatási módszerek alkalmazására.

Nem a méret a lényeg

Ön telepítene ilyen szoftvert a mobiltelefonjára?

  • 1797
    Nem
  • 438
    Főleg attól függ, milyen adatot használ fel
  • 100
    Főleg attól függ, mennyire lassítja a telefont
  • 95
    Igen, mindegy, milyen adatot használ fel

Mivel az ilyen jellegű adatfeldolgozás legismertebb példája az influenzajárvány terjedését vizualizáló Google Flu Trends, megkérdeztük a webkettes orvoslás egyik hazai szakértőjét, a webicina.com vezetőjét, dr. Meskó Bertalant is. A személyre szabott orvoslás lehetőségeinek kiszélesítésén is dolgozó szakember bár nem vesz részt az ezzel kapcsolatos kutatásban és munkában, egyetért a FuturICT távlati céljaival, hisz abban, hogy az egyelőre csak elméleti alkalmazások megvalósíthatók lesznek, de fő buktatóként ő is az adatvédelmi problémákat nevezte meg.

Szerinte nem véletlen például az, hogy az USA-ban hozzá sem kezdhetnek egy ilyen rendszer tervezéséhez addig, amíg nem követnek el mindent azért, hogy idegenek ne férhessenek hozzá a személyes adatainkhoz. Meskó szerint azonban azt is érdemes tudni, hogy önmagában a nagy adattömeg még semmit sem jelent. A Google Flu Trends például ugyan hatalmas mintát felhasználva működik, ugyanakkor ez a minta nagyon véletlenszerű is tud lenni. Így lehet az, hogy egy amerikai tanulmány szerint a keresőóriás influenza-előrejelzései egy kicsit sem pontosabbak vagy gyorsabbak, mint az Amerikai Járványügyi Hivatal ugyanebben a témakörben kiadott figyelmeztetései.

„De tegyük fel, hogy az adatvédelmi problémákat, és az adatok folyamatos frissen tartásához szükséges mintavételezési feladatokat is megoldják” – mondja Meskó. „Egyszerűen annyira szerteágazó ez a projekt, mind céljai, mind a megvalósítói tekintetében, hogy az elméletben kidolgozott metodikákat először saját magukon kellene kipróbálniuk.” A szakember szerint az is fontos, hogy ne a jövőt megjósoló, nagy gépet lássuk a FuturICT-projektben. „A nagy tömegű adatokon lefuttatott szimulációk lényege, hogy a 80 lehetőségből segítenek kiválasztani azt a pár darabot, amit tényleg érdemes megpróbálni.”

Meskó megnyugtató választ adott arra a kérdésre is, hogy nem kell-e attól félni, hogy az egész projekt célja valójában nem más, mint egy több millió telefonból álló, mindent látó és halló gépezet megépítése. Szerinte számos olyan felfedezés volt már, ami nem született volna meg, ha a kutatók csak azt tartják szem előtt, hogy vajon mi lesz, ha rossz kezekbe kerül a technológia. Jelasity és Meskó is egyetértettek abban, hogy ha a helyes elemzési eljárás, és a ma elérhető adatmennyiség, illetve számítási kapacitás találkozik, az mindenképpen fontos tudományos áttörést, vagyis egy élhetőbb, fenntarthatóbb jövőt jelent majd.

Rovatok