Index Vakbarát Hírportál

Mesterséges intelligenciával rontottunk rá Orbán Viktorra

2015. szeptember 14., hétfő 14:54

Az IBM Watson négy éve megnyert egy tévés műveltségi vetélkedőt, amelyben a fejtörők megoldásához a lexikális háttértudáson felül rendkívüli nyelvi képességekre volt szüksége. Ma már az egészségügyben kamatoztatja a tudását, a radiológusok terheltségét csökkenti, de szövegeket is elemez, mint egy gépi pszichológus. Mi Orbán Viktor beszédeit világítottuk át a gépi intelligenciával.

Az IBM Watson személyiségelemző szolgáltatása mondataink összetett nyelvi elemzésével fejti meg, hogy milyenek vagyunk. A szolgáltatást az amerikai elnökök beszédeivel mutatják be, ezért mi is hasonló szövegekkel etettük meg algoritmusokat: azt elemeztük, hogy a menekültválság kiteljesedése mennyire változtatta meg Orbán Viktor hangulatát a valamivel könnyedebb bálványosi beszéd óta.

Az elemzéshez a magyar kormány weboldalán lévő hivatalos angol nyelvű fordításokat használtuk fel. A tusványosi beszéd szélesebb közönségnek szólt, a szeptember 9-i azonban nagyköveteknek.

Azt mi is látjuk, hogy Orbán magyar nyelvű beszédei sokkal színesebb fordulatokban és képekben bővelkednek, mint az angol fordítás, de még így is szerencsésebb ezzel dolgozni, mint a Google Fordítóra ráereszteni több ezer karakternyi illiberálist, gazdasági bevándorlót és menekültet; a Google online tolmácsgépe ennél jóval egyszerűbb szövegeket is nagyon durván félrefordít. A Kormány.hu-n elérhető hivatalos fordítások előnye, hogy pontosan azt tükrözik, hogy a miniszterelnök mit akar mutatni a külföldieknek.

Az IBM által kifejlesztett Watson bizonyos szavak és szótípusok használatának gyakoriságából következtet személyiségre, gondolkodásmódra, társas kapcsolatokra és hangulatra. Az IBM természetesen nem csak programozókat alkalmaz, sőt, ebben a munkában sokkal nagyobb szerepük van a nyelvészeknek és pszichológusoknak. A beszédek elemzéséhez az IBM szakértői tudományos esszéket, blogbejezéseket és twiteket tanulmányoztak abból a szempontból, hogy milyen árulkodó jeleket találnak a szerző személyiségével kapcsolatban.

A Watson gépezete (itt érhető el) pillanatok alatt végez a rábízott munkával, érdemes többféle szöveggel is kipróbálni. Most csak angol és spanyol nyelven működik, és a legjobb eredményt akkor kapjuk, ha legalább 3500-6000 szavas írást töltünk fel. Az eredmény egy ehhez hasonló ábra (ezt Orbán idei tusványosi beszédéből rajzolta):

A gépi elemzés azt hozta ki, hogy a bevándorlókkal és migránsokkal foglalkozó tusványosi beszéd óta nagy változások történtek a múlt héten. A nagyköveti beszédben a 2014-es tusványosihoz képest csökkent a kalandvágy (75% -> 63% ), a miniszterelnök sokkal kevésbé óvatoskodó (82% -> 67%), ugyanakkor sokkal magabiztosabb (34% -> 79%), extrovertáltabb (28% -> 57%), barátságosabb (23% -> 60%) és jobban kifejezi a csapatszellemet (6% -> 20%).

Az eredményeket táblázatban is összefoglaltuk:

Orbán most kevésbé keresi a kihívásokat, a kíváncsisága is csökkent, de a harmóniára való igénye kifejeződik a beszédéből. A változásra meglehetősen nyitott, de a szerénység szobrát nem róla kell mintázni. Azt azért hozzá kell tenni az elemzéshez, hogy mi is látjuk a szerkesztőségben, milyen elképesztő fordulatok történnek az országban. Ahogy a politikai újságíróink is megfogalmazták, azt is lehetetlen előre megmondani, mi fog történni holnap.    

60 évnyi fejlesztést fog össze

A Watsonban benne van minden, amit a mesterséges intelligencia fejlesztésének hat évtizede alatt kitaláltak a tudósok. Megjelenése előtt nagyon gyengén szerepeltek a gépek, körülbelül minden harmadik válaszuk volt elfogadható. Az áttörést az hozta, hogy az IBM a természetes emberi nyelv feldolgozását műveli sokkal jobban az elődjeinél.

A nyelvfeldolgozásnak vannak egyszerű részei, ami szintaktikai elemzésből, valamint a szövegkörnyezet figyelembe vételéből áll. Ezen statisztikán alapuló megoldások közé tartoznak a mobilokban megtalálható hangvezérelt asszisztensek, az Apple Siri és a Microsoft Cortana, és az online tolmácsoló Google Fordító.

A Watson azonban általános tudással is rendelkezik, ami Sepp Norbert, az intelligens eszköz magyar szakértője az alábbi példával szemléltetett nekünk:

Ha azt mondjuk, hogy minden amerikainak van anyja, akkor az emberek fejében sok százezer anyuka képe jelenik meg. Cseréljük ki az anyuka szót arra, hogy elnök, és ebben az esetben a szintaktika szintjén semmi sem változik, mégis, a fejünkben egyetlen ember képe bukkan fel.

Mi ugyanis tudjuk, hogy minden egyes embernek van egy anyja, és azt is, hogy az elnökök egy egész ország élén állnak.

Az IBM célja a Watsonnal, hogy úgy tudjunk feladatokat adni neki, mint egy munkatársunknak, és ugyanolyan hasznos is legyen. Nem is mesterséges intelligenciának nevezik a képességeit, hanem kiterjesztett intelligenciának (intelligence augmentation), ami arra utal, hogy az emberi tudást bővíti ki.

A legújabb fejlesztési irány a képi tartalmak elemzése, amit az egészségügyben tesztelnek. A radiológusok munkájának egyik nehézsége, hogy naponta több ezer röntgenfelvételt kell átnézniük, és délutánra „elfárad a szemük”, a rengeteg nagyon hasonló képen nem veszik észre az apró különbségeket. A Watson előfeldolgozást végez, és a kép értelmezésével néhány tucatra tudja szűkíteni a radiológus által átnézendő felvételek számát.

Rovatok