Egy éve indult a Budapest Főváros Levéltára és az Arcanum Adatbázis Kiadó nagyszerű közös digitális internetes projektje, a Budapest Időgép, ami kereshető, többrétegű, időben differenciálható térképes alkalmazásban teszi kutathatóvá a magyar főváros házaihoz kapcsolódó levéltári és egyéb közgyűjteményi adatokat. Ez így leírva lehet, hogy nem tűnik vajmi izgalmasnak, pedig a történelem, a helytörténet, a saját lakhelyük rég elfeledett sztorijai iránt érdeklődőknek valóságos kincsesbánya ez, aminek használatához ráadásul nem kell otthonról egy tapodtat se kimozdulni, elég felkeresni hozzá a Hungaricana közgyűjteményi portált.
Vissza a múltba – Budapest Időgép néven egy olyan alkalmazás indul el, ami soha nem látott időkaput nyújt a legsajátabb történelmünkhöz. Fussa át a cikket, majd keressen rá azonnal az Ön számára kedves épületekre – itt a digitális kánaán, és ez már csak jobb lesz
– ezt írtuk a projekt indulásakor, és nem túloztunk, a Budapest Időgép valóban folyamatosan fejlődik, a jelek szerint esetében nem egy nagy lendülettel elindított, aztán hamvába holt kezdeményezésről beszélünk (láttunk már pár ilyet). Egy év alatt több százezer digitalizált adattal bővült a Budapest Időgép alkalmazás.
A Budapest Időgép jelenleg négy alapvető funkcióval bír:
A fenti térképes keresőkkel a felhasználók megnézhetik, hogy például saját jelenlegi, vagy volt lakhelyükről milyen régi dokumentumok, tulajdoni lapok, tervrajzok rejtőznek a levéltári polcokon, ha felbukkannak fotók, képeslapok is, láthatják a száz évvel ezelőtti állapotokat, a környéket, az utcákat, az embereket, talán még a nagypapát is, amint az ablakban pipázik.
A levéltárban pénteken sajtótájékoztatón számoltak be a projekt résztvevői az elmúlt egy év alatt véghezvitt munkákról, fejlesztésekről, valamint a tervezett feladatokról. Mint kiderült, a fejlesztések fókusza az I. világháború száz évvel ezelőtti korszakán volt, illetve nyilvánossá és kereshetővé tettek egy sor nagyon fontos politikai periratot is.
Kenyeres István, Budapest Főváros Levéltárának főigazgatója röviden összefoglalva elmondta, hogy a projekt az elmúlt egy évben az I. világháború időszakára koncentrált, elérhetővé téve a budapesti közjegyzők által 1914-1918 között felvett okiratok és jegyzőkönyveket, bepillantást engedve ezáltal a hátországi lakosság mindennapjaiba. A Budapest Időgépen két nagy budapesti közgyűjtemény, a Budapest Főváros Levéltára és a Fővárosi Szabó Ervin Könyvtár közös munkájának eredményét lehet jelenleg böngészni, de a közeljövőben igyekeznek a Budapesti Történeti Múzeumot is bevonni ebbe a munkába, ami a 150 éves Budapest évfordulóhoz méltó is lenne. Fodor Péter, a Fővárosi Szabó Ervin Könyvtár főigazgatója ez utóbbival kapcsolatban elmondta, hogy 2023-ban lesz a nevezetes évforduló, de a projekt nem áll le, legalább tízéves távlatban, 2030-ig terveznek a Budapest Időgépet illetően.
A Budapest Időgép új fejlesztéseit Sipos András, a levéltár főosztályvezetője foglalta össze, megemlítve, hogy a projekt része a Time Machine FET Flagship "Big Data of the Past" vállalkozásnak, ami kétezer év európai történelmet szeretne feltérképezni és összekötni, a különböző minőségű és struktúrájú történeti adathalmazok integrálásával. Ebben a folyamatban a magyar fél, azaz a Budapest Időgép élen jár, az EU-s együttműködők közül elsőként tudott működő időgéppel előállni. (Velence és Amszterdam mostanra kezdenek felzárkózni ebben a folyamatban.)
A mostani fejlesztés, például a korszak közjegyzői iratainak feldolgozása nemcsak a levéltári, könyvtári dokumentumok beszkennelését, digitalizálását jelenti, az adatfeldolgozás folyamatai mélyén digitalizált és georeferált helyrajzi adatok feltárása zajlik, ami a közeljövőben mesterséges intelligencia fejlesztésekhez is kapcsolódhat majd. Mint Sipos András elmondta, a jövőben igyekeznek minél több adatforrástípust bevonni, egy adott helyszínhez, épülethez minél több és többféle adatot hozzárendelni.
A Budapest Időgép nagy előnye, hogy keresőmotorja automatikus karakterfelismeréssel működik, azaz a képként digitalizált dokumentumokban is képes szöveges információt felismerni, és ezt viszonylag kicsi hibaszázalékkal teszi. Ennek köszönhetően nem manuálisan kell bevinni az adatokat a rendszerbe, ami például egy százéves fővárosi címtár esetében embertelenül nagy munka lenne, rengeteg hibalehetőséggel.
Sipos András szerint az Időgép kivételes eszközt ad a történészek kezébe: a most bekerült közjegyzői iratok segítségével egy adott terület, az ott élő emberek, közösségek viszonyait, interakcióit lehet feltárni, ami forradalmasíthatja a múlt nagy adathalmazaiban megbújó kapcsolati hálók, mintázatok megrajzolását.
Sándor Tibor, a FSZEK osztályvezetője pár érdekes adattal világította meg, hogy mit jelent az Időgép fejlesztésében a könyvtár állományának idén megkezdett célzatos digitalizálása. A FSZEK Budapest Gyűjteménye ugyanis a legnagyobb hazai helytörténeti gyűjtemény: 125 000 kötet, 680 000 kisnyomtatvány, plakát, analóg és digitális fotó kutatható, ebből 2500 kötet, 400 000 oldalnyi cikk, fotó, plakát van digitalizálva és a FSZEK netes adatbázisából 2017-ben 930 000 oldalmegtekintés történt.
A FSZEK fél éve csatlakozott a projekthez: az 1916-os, 2600 oldalas fővárosi címtár volt az első amit felvittek, azóta pedig folyamatban van az 1893-1950 közötti összes címtár (telefonkönyvek, lakónyilvántartások stb.) feldolgozása. Hogy mit jelent ez az adatintegráció?
Millió név, cég, intézmény lett kereshető a korszakból. Csak az 1916-os címtár ház és telekjegyzékében, 400 000 rekord van. Olyan mint egy cégjegyzék, vagy gazdasági címtár, afféle Yellow Pages és lakcímjegyzék egyben
– mondta Sándor Tibor. Mivel 1916-ban már csaknem egymillió lakosa volt Budapestnek, a FSZEK a térképre vitt adatokból készített egy kb 2000 tételes szűrést: a fontos intézmények, cégek, objektumok, iskolák, szállodák, mozik, éttermek, templomok, laktanyák könnyen, egy kattintással elérhetők egy adott terület böngészése közben.
Az írott szövegek kutatóinak rengeteget segíthet az időgép: mivel teljesen szövegalapú keresésre is van mód, irodalmi leírásokat lehet tényleges adatalapú leírásokkal összevetni, akár mai címekkel is, ehhez elég a térképre felvitt helyrajzi számra klikkelve lekérni a rendelkezésre álló integrált adathalmazokat.
Roppant izgalmas része az elvégzett digitalizálási munkának a FSZEK első világháborús plakátgyűjteményének teljes felvitele: 1914 és 1919-1920 közötti évekből 2500 plakát tartalmában lehet mostantól keresni. Hogy miért fontos történeti forrás ez? A plakáthirdetmények voltak akkoriban a hivatalos közlés legfontosabb csatornái.
Meg lehet érteni belőlük, hogy miért lett elege az embereknek a háborúból. Akárhova nézünk, valami megszorításról, rendeleti korlátozásról van szó bennük
– magyarázta Sándor Tibor. És mivel a szövegfelismerő módszerrel a tartalmukban lehet keresni, a plakátokon alapuló forráskutatás új szintre léphet, újabb dimenziót nyitva a társadalomkutatóknak.
Nem tartozik szorosan az időgép térképes keresőjének fejlesztéséhez, azonban fontos politikatörténeti dokumentumok is elérhetővé váltak a Hungaricana oldalain: kiemelt jelentőségű politikai perek (többek között a Tisza-, a Károlyi-, a Szamuely-, a Héjjas-, és a Rákosi-perek) anyagát digitalizálták a levéltárban. Sarusi Kiss Béla főosztályvezető elmondta, hogy egy év alatt 32 000 oldalt dolgoztak fel, többek között olyan anyagokat, amikre annak idején a munkásmozgalmi intézet rátette a kezét, és amiket csak a rendszerváltás után kapott vissza a levéltár.
Az internetes forrásközlésre került periratok feldolgozása nem volt könnyű, rengeteg kézírásos, azaz szoftveres szövegfelismeréssel nem kezelhető anyagról van szó, ráadásul a munkásmozgalmi intézet kezelésébe került dokumentumokhoz a politikai vezetők, potentátok is hozzáférhettek, kivehették és rendszerint ki is vették, eltüntették a rájuk nézve kellemetlen periratokat.