Index Vakbarát Hírportál

Jó kérdésre hülye válasz

2010. augusztus 30., hétfő 01:06

Kérdésekre és válaszokra alapuló kereső már régóta létezik, de a Swingly, ami profi adatbányászok tapasztalatai alapján készült, azt állítja magáról, hogy működik is. Működni működik, csak még buta.

Louis-Ferdinand Céline 1894-ben született, Sierra Leonéban 4,7 millióan laknak, a világ leggyorsabb sorozatgyártású autója a Shelby SSC Ultimate Aero TT, és a magyar labdarúgó-válogatott szövetségi kapitánya nem Erwin Koeman – legalábbis így tudja a Swingly.com, a legújabb, kérdezz-felelek-elvre épülő kereső.

A valóság ezzel szemben az, hogy Céline 1894-ben született, Sierra Leone népessége 5,24 millió, a leggyorsabb utcai kocsi a Bugatti Veyron Super Sport, és a magyar válogatott kapitánya Egervári Sándor, vagyis a Swingly négy véletlenszerűen feltett kérdésből egyre tudja a választ, egyre nem, kettőre meg rosszul tudja.

Pedig az ötlet jó, mert ha az ember a neten keres, a legtöbbször nem random szájtokra és az ott felhalmozott adattömegre kíváncsi, hanem konkrét kérdésekre szeretne konkrét válaszokat kapni. Van-e élet a halál után? Létezik-e igaz szerelem? Hol árulnak minőségi gyapjúzoknit?

Ezt a természetes igényt jó néhány cég már igen korán felismerte. A mostanra Nagy-Britannián kívül ask.com-ra átkeresztelt Ask Jeeves 1996-ban, évekkel a Google megalakulása előtt próbálkozott rendes, emberi nyelven feltett kérdésekre rendes, emberi nyelven megfogalmazott válaszokat adni, de nem sok sikerrel: most, másfél évtizeddel később még mindig nem tudja kapásból megmondani, ki alapította az AC/DC-t. A jelenleg publikus bétaállapotban kipróbálható Swingly a Young fivéreket legalább a kisujjából kirázza.

Keresőmotor helyett válaszmotor

Miközben a Google szép lassan a de facto keresővé vált, a kérdezz–felelek-paradigma tovább izgatta a szakembereket. 2005-ben elindult a Yahoo Answers, amely nem gépi algoritmusokra, hanem a közösség erejére bízta a válaszadást, és persze hazai változata, a gyakorikerdesek.hu-is, olyan klasszikusokkal, mint a „Mit tudok csinálni egy üveg borsóval?”, illetve „Újszülött cumisüvegjét moshatom együtt majd a nagytestvérével?”.

Nincs egy hónapja, hogy a Facebook a Yahoo mintájára bevezette Questions nevű szolgáltatását, de rég van már WikiAnswers, AskDeb, sőt emberi erővel hajtott keresőmotor is, a ChaCha, ahol eredetileg cseten, egy ideje sms-ben és telefonon lehet dolgoztatni a humán erőforrást. Akik persze a Google-ön keresnek, de ez most mindegy. Tavaly indult a Wolfram Alpha, amelyről kitalálója, Stephen Wolfram matematikus azt ígérte, hogy nem megkeresi, hanem egyenesen kiszámítja a választ a látogatókban felmerülő kérdésekre – igaz, az eredmény sajnos túlságosan függ attól, milyen kérdések merülnek fel a látogatókban.

Ebbe a népes, mégis viszonylag homogén összetételű társaságba robbant be váratlanul a Swingly, ami gépi algoritmusokkal dolgozik, ugyanakkor olyan nagy tapasztalata van a szemantikus keresésben és indexelésben, hogy már most, a bétafázisban azt állítja: 100-150 milliárd kérdésre tudja a választ. A beta.swingly.com-on a megválaszolt kérdéseket jelző számláló 93 574 820 404-nél jár, és másodpercenként több százat ugrik.

A kormánynak is dolgoznak

A válaszológépnek látszó kereső nem ember által írt válaszokat, megoldásokat kínál fel, hanem a webről, cikkekből, posztokból és kommentekből állítja össze a kérdés–felelet-párokat, némelyeket készen, adatbázisból, a többit valós időben, a maradékot a felhasználók javaslatai alapján.

A Swingly működéséért egy természetesnyelv-feldolgozó rendszer felel, amelyet a texasi székhelyű Language Computer Corporation már tizenöt éve használ arra, hogy nagy mennyiségű adatból kibányássza az értékes információt. A cég igazgatója, egyben a Swingly atyja, Andrew Hickl a Cnetnek azt mondta, az elmúlt években az amerikai kormány rendszeresen őket kereste meg, amikor nem volt elégedett a rendelkezésére álló adatbányászati eszközökkel.

A megszokott keresőkhöz képest a Swingly egyelőre elég lassú: másodpercekig is teker, mire előáll a válasszal („Hurrá! Azt hiszem, megvan!”) vagy mire rájön, hogy fogalma sincs (Ó, nem! Azt hiszem, nem erre voltál kíváncsi.”). Bár a nagy keresők, a Google, a Bing és a Yahoo a sebességet tekintve magasan túlszárnyalják, ha valóban tökéletes választ adna, nyilván érdemes lenne várni rá. Sajnos a Swingly válaszaiból levonható legfontosabb tanulság, hogy minden válaszadó gép annyit ér, amennyit az algoritmus és a források, amiket használ.

Ránézésre a Swingly előszeretettel használja a Wikipediát, az answers.com wiki-adatbázisát, a Yahoo Answerst – tehát a közvetlen konkurenciát –,  de néha olyan érthetetlen források is feltűnnek, mint az archive.org, ami az internet őskövületeit raktározza. A források pedig nem mindig pontosak, és gyakran elavultak: a Sierra Leone-i népességre vonatkozó adat legalább kétéves, miközben a megbízhatónak tartott CIA Factbookon ott az idei szám.

Yippee! I think I've got it!

A nyelvfeldolgozó modulon is lehetne még dolgozni: a Swingly teljesen más forrásokból ad találatokat, ha azt kérdezzük tőle, melyik a leggyorsabb sorozatgyártású autó a Földön, mint ha azt, hogy melyik a leggyorsabb a világon – az előbbi kérdésre nem találja a választ, de felajánlja a Corvette-et és az Audit, míg az utóbbira a Shelby SCC-t. (A Google és az Index által korábban leszólt Wolfram Alpha bezzeg kapásból jó találatot ad, a Veyront.)

A vetélytársakhoz képest mégis van a Swinglynek egy óriási előnye, nevezetesen hogy a válaszok szerkeszthetők és kommentálhatók, vagyis a motor nem bíz mindent az algoritmusra, hanem teret enged a közösségi inputnak is – ha elegen használják majd, és mindenki hajlandó beletenni egy kicsit, lehet még belőle jól használható különleges tudakozó. Főleg ha megtanul más nyelveken is, mert egyelőre angolul sem tud rendesen.

Ja, és a legfontosabb: a halál után van élet, igenis létezik igaz szerelem, és Helton Samo Cunha valószínűleg gyapjúzoknit hord.

Rovatok