Az IBM Watson négy éve megnyert egy tévés műveltségi vetélkedőt, amelyben a fejtörők megoldásához a lexikális háttértudáson felül rendkívüli nyelvi képességekre volt szüksége. Ma már az egészségügyben kamatoztatja a tudását, a radiológusok terheltségét csökkenti, de szövegeket is elemez, mint egy gépi pszichológus. Mi Orbán Viktor beszédeit világítottuk át a gépi intelligenciával.
Az IBM Watson személyiségelemző szolgáltatása mondataink összetett nyelvi elemzésével fejti meg, hogy milyenek vagyunk. A szolgáltatást az amerikai elnökök beszédeivel mutatják be, ezért mi is hasonló szövegekkel etettük meg algoritmusokat: azt elemeztük, hogy a menekültválság kiteljesedése mennyire változtatta meg Orbán Viktor hangulatát a valamivel könnyedebb bálványosi beszéd óta.
Az elemzéshez a magyar kormány weboldalán lévő hivatalos angol nyelvű fordításokat használtuk fel. A tusványosi beszéd szélesebb közönségnek szólt, a szeptember 9-i azonban nagyköveteknek.
Azt mi is látjuk, hogy Orbán magyar nyelvű beszédei sokkal színesebb fordulatokban és képekben bővelkednek, mint az angol fordítás, de még így is szerencsésebb ezzel dolgozni, mint a Google Fordítóra ráereszteni több ezer karakternyi illiberálist, gazdasági bevándorlót és menekültet; a Google online tolmácsgépe ennél jóval egyszerűbb szövegeket is nagyon durván félrefordít. A Kormány.hu-n elérhető hivatalos fordítások előnye, hogy pontosan azt tükrözik, hogy a miniszterelnök mit akar mutatni a külföldieknek.
Az IBM által kifejlesztett Watson bizonyos szavak és szótípusok használatának gyakoriságából következtet személyiségre, gondolkodásmódra, társas kapcsolatokra és hangulatra. Az IBM természetesen nem csak programozókat alkalmaz, sőt, ebben a munkában sokkal nagyobb szerepük van a nyelvészeknek és pszichológusoknak. A beszédek elemzéséhez az IBM szakértői tudományos esszéket, blogbejezéseket és twiteket tanulmányoztak abból a szempontból, hogy milyen árulkodó jeleket találnak a szerző személyiségével kapcsolatban.
A Watson gépezete (itt érhető el) pillanatok alatt végez a rábízott munkával, érdemes többféle szöveggel is kipróbálni. Most csak angol és spanyol nyelven működik, és a legjobb eredményt akkor kapjuk, ha legalább 3500-6000 szavas írást töltünk fel. Az eredmény egy ehhez hasonló ábra (ezt Orbán idei tusványosi beszédéből rajzolta):
A gépi elemzés azt hozta ki, hogy a bevándorlókkal és migránsokkal foglalkozó tusványosi beszéd óta nagy változások történtek a múlt héten. A nagyköveti beszédben a 2014-es tusványosihoz képest csökkent a kalandvágy (75% -> 63% ), a miniszterelnök sokkal kevésbé óvatoskodó (82% -> 67%), ugyanakkor sokkal magabiztosabb (34% -> 79%), extrovertáltabb (28% -> 57%), barátságosabb (23% -> 60%) és jobban kifejezi a csapatszellemet (6% -> 20%).
Az eredményeket táblázatban is összefoglaltuk:
Orbán most kevésbé keresi a kihívásokat, a kíváncsisága is csökkent, de a harmóniára való igénye kifejeződik a beszédéből. A változásra meglehetősen nyitott, de a szerénység szobrát nem róla kell mintázni. Azt azért hozzá kell tenni az elemzéshez, hogy mi is látjuk a szerkesztőségben, milyen elképesztő fordulatok történnek az országban. Ahogy a politikai újságíróink is megfogalmazták, azt is lehetetlen előre megmondani, mi fog történni holnap.
A Watsonban benne van minden, amit a mesterséges intelligencia fejlesztésének hat évtizede alatt kitaláltak a tudósok. Megjelenése előtt nagyon gyengén szerepeltek a gépek, körülbelül minden harmadik válaszuk volt elfogadható. Az áttörést az hozta, hogy az IBM a természetes emberi nyelv feldolgozását műveli sokkal jobban az elődjeinél.
A nyelvfeldolgozásnak vannak egyszerű részei, ami szintaktikai elemzésből, valamint a szövegkörnyezet figyelembe vételéből áll. Ezen statisztikán alapuló megoldások közé tartoznak a mobilokban megtalálható hangvezérelt asszisztensek, az Apple Siri és a Microsoft Cortana, és az online tolmácsoló Google Fordító.
A Watson azonban általános tudással is rendelkezik, ami Sepp Norbert, az intelligens eszköz magyar szakértője az alábbi példával szemléltetett nekünk:
Ha azt mondjuk, hogy minden amerikainak van anyja, akkor az emberek fejében sok százezer anyuka képe jelenik meg. Cseréljük ki az anyuka szót arra, hogy elnök, és ebben az esetben a szintaktika szintjén semmi sem változik, mégis, a fejünkben egyetlen ember képe bukkan fel.
Mi ugyanis tudjuk, hogy minden egyes embernek van egy anyja, és azt is, hogy az elnökök egy egész ország élén állnak.
Az IBM célja a Watsonnal, hogy úgy tudjunk feladatokat adni neki, mint egy munkatársunknak, és ugyanolyan hasznos is legyen. Nem is mesterséges intelligenciának nevezik a képességeit, hanem kiterjesztett intelligenciának (intelligence augmentation), ami arra utal, hogy az emberi tudást bővíti ki.
A legújabb fejlesztési irány a képi tartalmak elemzése, amit az egészségügyben tesztelnek. A radiológusok munkájának egyik nehézsége, hogy naponta több ezer röntgenfelvételt kell átnézniük, és délutánra „elfárad a szemük”, a rengeteg nagyon hasonló képen nem veszik észre az apró különbségeket. A Watson előfeldolgozást végez, és a kép értelmezésével néhány tucatra tudja szűkíteni a radiológus által átnézendő felvételek számát.