Egyre több olyan adat keletkezik a világban, ami Budapesten nyer értelmet. Nemzetközi nagyvállalatok, köztük Fortune 500-as óriások egy hazai IT-tanácsadó cég segítségével próbálnak megbirkózni azzal a hatalmas információmennyiséggel, ami üzleti folyamataik során keletkezik. A magyar big data tudás értékes exportcikké vált, a budapesti csapat ügyfelei között olyan neveket találni, mint a Facebook, az Apple, a Tesla, a Netflix, a Disney vagy az Európai Bizottság.
Gyakorlatilag minden műszaki eszköz, ami környezetünkben található, ontja magából az adatokat. Információk keletkeznek, ha telefonálunk, ha rákeresünk valamire az interneten, ha rendelünk valamit, ha bemegyünk egy üzletbe, ha bankkártyával fizetünk, vagy ha felkapcsoljuk a villanyt a konyhában. Olyan korban élünk, amikor adatforrásként tekinthetünk testünkre, mozgásunkra, viselkedésünkre és döntéseinkre. Bármi, amit teszünk, digitális nyomot hagy, és számok, képek, szövegek vagy navigációs adatok formájában tárolódik valahol.
Ebben az óriási adattengerben izgalmas összefüggések, szabályszerűségek és minták rejlenek, amelyek feltárására, vagyis a big data hasznosítására egyre nagyobb az igény az élet szinte minden területén az egészségügytől kezdve a közlekedésen át az időjárás-előrejelzésig. A felhalmozott adatok nem mellesleg hatalmas üzleti értékkel bírnak a vállalatok számára. Aki képes tárolni, strukturálni és gyorsan elemezni ezeket, komoly versenyelőnyre tehet szert.
Ma a big data technológiákra épülő megoldások és szolgáltatások a globális IT piac igen gyorsan bővülő területe, amelynek mérete szakértői becslések szerint 2019-re a 190 milliárd dollárt is elérheti. A bővülés ütemét jelzi, hogy világszerte több millió betöltetlen álláshely várja a megfelelő képzettséggel rendelkező adattudósokat. Az üzleti oldalon jelentkező igények oly mértékben növekednek, hogy a képzések jelenleg sehol a világon nem tudnak lépést tartani a munkaerőpiac által diktált tempóval. Egyedül a Szilícium-völgyben több százezer big data gurura lenne szükség, de az üres pozíciókat annak ellenére nehéz betölteni, hogy már a kezdőket is 100 ezer dollár feletti éves átlagjövedelemmel csábítják. Ezen a terepen lett ismert játékos egy magyar cég, aminek ajtaján manapság a legnagyobb nemzetközi vállalatok kopogtatnak.
A budapesti székhelyű Starschema Kft-t 2006-ban alapította néhány szabadúszó informatikai tanácsadó. Eleinte főleg hagyományos üzletiintelligencia-projektek kivitelezésén dolgoztak, majd az akkortájt megjelenő alternatív adatfeldolgozási módszerek felé fordult érdeklődésük, és az elsők között sajátítottak el új technológiákat. Miután megoldottak pár nehéz feladatot, a referenciák birtokában arra törekedtek, hogy leendő megrendelőik hasonlóan komplex problémákkal keressék meg őket.
2013 volt a fordulópont, a magyar adattudósok ekkor vetették meg a lábukat az amerikai piacon, és nemsokára olyan ügyfeleket tudhattak magukénak, mint az Apple, a Facebook vagy a Netflix. Árbevételüket azóta minden évben duplázták, így 2016-ban elérték a 2 milliárd forintos határt, alkalmazottaik száma pedig a többszörösére nőtt. A tempó olyan nagy volt, hogy a Starschema felkerült az amerikai Inc. magazin által 2016 elején kiadott listára, amin a leggyorsabban növekvő európai vállalkozások szerepelnek. A cég várakozásai szerint adózás előtti nyeresége is emelkedik 160 millió forintra az előző évi 116,2 millióról.
Földi Tamás, a cég ügyvezetője szerint sikerük egyik titka, hogy valami olyat tudnak, amit senki más. „Meg kell keresni azt a kevesek által nyújtott szolgáltatást, amire olyan nagy az igény, hogy mindegy ki vagy, mindegy honnan jössz, megveszik tőled, mert máshonnan nem kapják meg” – mondja. Ez azonban önmagában kevés ahhoz, hogy egy magyarországi cég híre átérjen a tengerentúlra.
A big data szolgáltatásokat nem egy kéthetes Google Adwords kampánnyal fogod eladni. Ehhez arra van szükség, hogy az iparág megismerjen, és ezáltal személyes kapcsolatokra tegyél szert. A szakmai fórumok és blogok például kiválóan alkalmasak arra, hogy megvillantsd a tudásod. Aktívak voltunk, jó tanácsokat adtunk, így felfigyeltek ránk.
A Starschema így partneri viszonyba került a világ egyik vezető adatelemző és adatvizualizációs eszközöket fejlesztő cégével, a Tableau Software-rel. A New York-i tőzsdén is jegyzett technológiai nagyvállalat megnyitotta az utat a Fortune 500-as óriások felé. A megbízások többségénél szigorú titoktartás kötelezi a magyar startupot, hiszen azt, hogy az ügyfél épp min dolgozik, már a feldolgozott adatok típusából is kikövetkeztethetik a versenytársak.
Akadnak persze olyan projektek, amiket névvel vagy név nélkül meg lehet említeni. A feladatokat alapvetően két csoportba érdemes sorolni. Az egyik a data science (nincs elfogadott magyar megfelelője) területe, ahol olyan algoritmusok kifejlesztése a cél, amikkel – a statisztikára, a gépi tanulásra és a nagy mennyiségű adatok feldolgozására támaszkodva – bonyolult összefüggések tárhatók fel. A Starschema data science csapatának tagjai elsősorban az ipari internetre fókuszálnak. Egy most futó projektben például azt vizsgálják, hogy milyen tényezők hatnak az USA területén található szélerőművek teljesítményére. Ennek részeként több évtizedre visszamenőleg dolgozzák fel a különböző időjárás előrejelzők adatait, köztük a Nemzeti Óceán- és Légköri Hivatal (NOAA) jelentéseit, hogy megnézzék, az adott területre ki adta a pontosabb becslést. Ez azért lényeges, mert minél pontosabb egy előrejelzés a szél irányára és erősségére vonatkozóan, annál jobb becslés adható arra az energiamennyiségre, amit a szélerőművek táplálnak a rendszerbe egy meghatározott időpontban. A végeredmény az adott területre vonatkozó energia előállítási árkalkuláció, amit egy algoritmus generál.
Egy korábbi projekt keretében a cég szakemberei a világ egyik vezető gázturbinagyártója számára fejlesztettek ki egy olyan hőkamerás képeket elemző algoritmust, aminek segítségével a mérnökök előre tudják jelezni a meghibásodásokat. Ezzel töredékére csökkenthető a szervízelési idő és a javítás költsége. Arról nem is beszélve, hogy a komplex rendszereknél, mint például egy gázturbinákat használó erőmű, egy nem tervezett leállás hatalmas bevételkiesést jelent. „Ezeknek a projekteknek az a közös metszete, hogy a számítógépeket nagy mennyiségű adat segítségével egyszerűen megtanítjuk a múlt eseményeire, vagyis arra, hogy mik voltak a normális működés jellemzői, és milyen körülmények között következtek be az anomáliák. Ilyenkor kollégáink szó szerint elmerülnek a szélerőművek vagy a gázturbinák világában, mert az adott téma részletes ismerete elengedhetetlen a megoldáshoz” – mondja Földi.
A másik terület, a data engineering ott kezdődik, ahol a data science véget ér. Itt már nem az elemző algoritmusok megalkotása a feladat, hanem az, hogy az adatelemzés és az adatvizualizáció hatalmas mennyiségű adatok esetén is gyorsan, akár valós időben elvégezhető legyen.
Remek példa erre az a megbízás, amivel a Netflix kereste meg a Starschemát. A feladat az volt, hogy a közel 90 millió előfizető által generált több százmillió adatot felhasználva a világ legnagyobb streamingszolgáltatójának elemzői másodpercek alatt hozzáférjenek a legfontosabb mutatószámokhoz, mint például a nézettség, a sorozat öregedés vagy a folytatási hajlandóság.
De nem a Netflix az egyetlen szilícium-völgyi ügyfél, amely gyorsítani akarja adatfeldolgozási folyamatait. A Facebook az adatvizualizációs szervereit egy ideje már a Starschema programjaival felügyeli és frissíti, jövőre pedig a magyar cég fogja segíteni a világ legnagyobb közösségi hálózatát egy olyan algoritmus elterjesztésében, amivel könnyebb és gyorsabb lesz felderíteni a gyanús felhasználói aktivitásokat.
A cég legújabb fogásai között található a harmadik legnagyobb amerikai hitelkártya-szolgáltató, a mintegy 60 millió kártyatulajdonost kiszolgáló Discover, valamint a hálózati eszközök és telekommunikációs berendezések gyártásával foglalkozó technológiai óriás, a Cisco Systems. Velük várhatóan 2017 első negyedévében kezdődik meg a közös munka. Folyamatosan érkeznek a megkeresések a tengerentúlról, de a véges kapacitás miatt ezek egy részére kénytelenek nemet mondani. Jelenleg 132 alkalmazottal teljesítik a megbízásokat, és mivel az országot sújtó informatikushiány miatt egyre nehezebb megfelelő tapasztalattal és képzettséggel rendelkező szakembereket találni, a további növekedésnek már most látszanak a korlátai.
A Starschema ezért több olyan egyetemmel és főiskolával is együttműködést alakított ki, ahol valamilyen formában adattudósokat képeznek. Ez elsősorban a cég szakértői által tartott rendszeres előadások és interaktív bemutatók révén valósul meg, de van példa szakdolgozati esettanulmányok kidolgozásának támogatására és gyakornoki programokra is.
A világ többi részéhez hasonlóan tehát Magyarországon sem tesz rossz lóra az, aki az adattudós pályát választja. Hornyák Miklós, a Pécsi Tudományegyetem Közgazdaságtudományi Karán belül működő Kvantitatív Intézet tanársegédje szerint a nemzetközi trendet követve a magyar vállalatok is egyre nagyobb arányban kezdik felismerni a működésük során keletkező adatokban rejlő lehetőségeket. „Mindenképpen perspektivikus, de egyáltalán nem könnyű pálya áll azok előtt, akik ezen a területen képzelik el a jövőjüket. Itt egyszerre van szükség erős informatikai, matematikai és statisztikai háttérre, de az elemző gondolkodás és az új ismeretek elsajátításának képessége is alapvető követelmény” – mondta az Indexnek Hornyák. A Pécsi Tudományegyetem egyébként az egyike azoknak a felsőoktatási intézménynek, amelyekkel a Starschema szoros partneri viszonyt alakított ki az elmúlt években.
Hornyák Miklós úgy véli, a hazai adattudósképzés színvonalát és a területen dolgozó szakemberek felkészültségét tekintve nemzetközi összehasonlításban nincs szégyenkeznivalónk. „Látni kell azonban, hogy ez egy viszonylag fiatal és dinamikusan fejlődő ágazat, ahol rövid időn belül is hatalmas lemaradásba kerülhetünk. Ahhoz, hogy pozíciónkat és versenyképességünket megőrizzük, az iparági szereplők erőteljesebb aktivitására és támogatására van szükség, különösen a Budapesten kívüli régiókban”.
Ne maradjon le semmiről!