Index Vakbarát Hírportál

Hír az, amit a web annak ítél

2010. január 27., szerda 10:35

Nagyszerű koncepció, szerencsétlen kivitelezés: a Factery Labs gépi módszerekkel igyekszik kibányászni a webes linktömegből a híreket. Ha ez a hírszerkesztés jövője, akkor egyelőre inkább a múlt.

Az iskolában azt tanítják, hogy a hírt az esemény aktualitása, földrajzi közelsége, egyedisége, relevanciája és szórakoztató jellege teszi hírré. Ja, és még a hatás, az kimaradt. A gyakorlatban viszont a hír az, amit a hírszerkesztő annak tart. De el lehet-e dönteni, mi a hír, ha nincs hírszerkesztő?

A hírmeghatározás és -terjesztés egészen eredeti módszerét dolgozta ki a Factery Labs, egy tavaly alapított szilícium-völgybeli cég, amely a Twitteren, a Google-ön és a Yahoon kibontakozó webes trendekre és az azokból automatikusan kibányászható információra  alapozza a hírek szelekcióját. „Mélyfúrást végzünk, átmegyünk a linkeken, be az oldalakra, és kiderítjük, van-e ott a felhasználónak értékes információ – mondta nemrég az egyik alapító, Paul Pedersen, aki korábban az Infoseeknel és a Google-nél dolgozott. „Ezek nem hírek; ezek olyan hírek, amelyek a web szerint hírek.”

A napokban élesített Factery Labs a keresőmotorok (search engines) analógiájára ténymotornak (fact engine) nevezi magát, és azt ígéri, hogy a neten terjedő linkekből kibányássza az érdemi információt, ráadásul valós időben, amire a weboldalak szisztematikus bejárását és indexelését végző hagyományos keresők nem képesek.

A Factery Labs folyamatosan követi az eseményeket – a Twitteren kívül a Google Trendset és a fejlesztők számára szabadon hozzáférhető Yahoo-féle keresőplatformot, a BOSS-t –, aztán átnézi a hivatkozott oldalakat, posztokat és tweeteket, és a Google PageRankjének mintájára elnevezett FactRank algoritmussal megkísérli kibányászni belőlük a tényeket. A legfőbb újdonság tehát az, hogy a többi keresővel és híraggregátorral szemben a Factery Labs nem pusztán linkeket, hanem releváns információt igyekszik tálalni egy-egy keresőkifejezésre.

A Factery Labs algoritmusait a cég alkalmazásfejlesztő felülete, a FactSource API révén sokféleképpen fel lehet használni. Az eddigi implementációk között szerepel például a FactFinder Source, ami azt demonstrálja, hogyan tud a ténymotor rendet vágni a valós idejű keresések kaotikus eredményeiben.

Ha például Haitire keres az ember a Twitteren, a legtöbb találat egy-egy címszerű mondat és egy url-rövidítővel készült, önmagában semmitmondó link. A FactFinder minden ilyen linkelt oldalra ellátogat, megpróbálja kiszűrni az ott található tényeket, és találatként azokat adja vissza, amivel időt spórol meg a felhasználónak, és elméletileg segít kihámozni a lényeget a tweetfolyamból.

A Factery Labs algoritmusát használja a Sobees közösségiszájt-aggregátor is, amely kereshetővé teszi a Facebookon, MySpace-en, LinkedInen és a Twitteren posztolt üzeneteket. Ez a fajta adatbányászat kifejezetten hasznos lehet a mobilnetezőknek, akik így kis képernyőre optimalizált, jól átlátható formában kapják a híreket.

Van még mit csiszolni

Na és hogy működik a Factery a gyakorlatban? A Haiti keresőkifejezésre a FactFinder Source több tucat találatot jelenít meg, ezeket a legfrissebb, vagy majdnem a legfrissebb Twitter-posztokból, blogokból és online újságokból szedi, ellátja őket egy százalékban megadott FactRankkel, vagyis nagyjából a találati pontosságot jelző értékkel, és a hivatkozott weboldalakról kimazsolázott tényekkel.

Ezek egy része teljesen releváns, megtudjuk például, hogy Haiti a világ egyik legszegényebb országa, hogy John Travolta éppen a szcientológia tanait terjeszti a földrengés károsultjai között, és hogy egy segélykoncert erejéig újra Robbie Williamsszel áll fel a Take That. A többi találat azonban a hivatkozott oldalakból véletlenszerűen  kirángatott mondat („De a tragédia új esélyt is jelent, és itt jön a képbe Tom Sehl”), ami nemhogy nem tény, de inkább növeli a káoszt, és a Factery által megtalált Twitter-posztoknak sokszor több értelmük van önmagukban, mint a melléjük rendelt random találatokkal együtt.

A Factery trendfigyelője is meglehetősen bugos, a Sport szekcióba kerültek az Apple bevételei, a Minnesota Vikings focicsapat kétszer is szerepel, és valamiért ide került a London Bridge; a Tech-szekcióban vannak viszont olyan témák, mint az egészségügyi reform és Brett Favre, a világhírű quarterback. A gép sem tudhat mindent.

És bár a Factery a hírműfajt szeretné újradefiniálni, sok esetben még csak nem is hírszerű. Bajnai Gordonról az első hat találat mind a Wikipediáról származik, és lexikális jellegű, életrajzi  adatokat tartalmaz, a hírnek szánt adatok között található két árva BBC-hír tavaly márciusi. Orbán Viktorral hasonló a helyzet, bár itt a fő forrás a Britannica.com, hírszerű információ még csak véletlenül sincs a találatok között. Még szerencse, hogy Robbie Williams már stúdióba is vonult a Take Thattel.

Rovatok