Egy kaliforniai startup dob mentőövet az adatok erdejében tévelygő újságíróknak.
Hirdetés
 

Mint kiderült, nem csak a Google és a Microsoft (no meg az NSA) térképezi fel a-tól z-ig az internetet, hanem egy kis kaliforniai startup is, amely most tudását a hiteles újságírás szolgálatába állítja. Az 2008-ban alapított Diffbot ugyanis partnerségre lépett egy európai újságíró szervezettel, az EJC-vel (European Journalism Centre), hogy olyan technológiai megoldásokkal segítse az adatújságírást, amik megkönnyítik a hamis információk kiszűrését.

Mint a ZDNet írja, az EJC mintegy kilencezer tagja a központ adatújságírásra specializálódott oldalán, a Data Journalismon keresztül férhet ingyenesen hozzá a startup legértékesebb eszközéhez, a Knowledge Graph-hoz.

A mesterséges intelligencia Szent Grálja

A Knowledge Graph lényegében egy tudásbázis, amely az interneten található több mint 10 milliárd entitásra és ezer milliárdot is meghaladó adatmennyiségre épül. Mindezt az információtömeget a Knowledge Graph mesterséges intelligencia segítésével olyan módon teszi lekérdezhetővé, mintha az egész internet egy strukturált adatbázis lenne. A Diffbot alapítója, Michael Tung egy tavalyi interjújában úgy írta le a rendszert, mint az interneten összegyűlt emberi tudás első átfogó térképét. Szerinte sikerült elkészítenie a gépi tanulás Szent Grálját, ami a világ összes tudását (már ami a neten elérhető) egy helyre gyűjti. Mint mondta, ehhez az internet minden oldalát elemezni kell, ami nyilvánvalóan elképzelhetetlen automatizálás és mesterséges intelligencia nélkül.

Az alapító, aki egyébként a Stanfordon, az egyetemi évei alatt kezdett el foglalkozni mélyebben a mesterséges intelligencia kutatásával, a számítógépes látás és a természetes nyelvfeldolgozás kombinációjára építette a rendszerét. Ez biztosítja, hogy a Diffbot webrobotja gyakorlatilag bármilyen felépítésű weboldalt képes elemezni, és az információkat szintetizálni.

A feldolgozás két lépésben történik: az információk begyűjtését robotok végzik – havonta mintegy 130 millió tényadattal gazdagodik a Knowledge Graph tudásbázisa –, és rendszerezik egy strukturált adatbázisban, ami a lekérdezéseket kiszolgálja. Mivel az információk rendszerezéséből kiiktatták az emberi tényezőt, ezért a rendszer mentes az előítéletektől és rendkívül pontos – állítja a cég. A szolgáltatás ismertetője szerint a Knowledge Graph bármilyen egyedi információt képes kinyerni, ha az az interneten megtalálható. A lekérdezésekhez, amiket egy egyszerű webes felületen kell megadni, készítettek egy saját lekérdező nyelvet is, a Diffbot Query Language-et.
 

Michael Tung, a Grál lovag


Ennek segítségével jól körül lehet írni a keresett információt. Ha például egy szerző cikkeire keres rá valaki, akkor állítólag a Knowledge Graph képes kiadni az adott szerző összes valaha megjelent cikkét bármilyen nyelven. Vagy ha valakinek az életútját szeretnénk megismerni, akkor a rendszer a különböző forrásokat szintetizálva adja meg az illető közel teljes – nyilvánosan elérhető információkból összeállítható – pályaképét/profilját.

Az adatok megjeleníthetők listában, táblázatban, de akár térképes formában is, hogy jobban megmutatkozzanak az összefüggések.

Gyorsítja az újságírók munkáját

Az újságírói munkához a Knowledge Graph kétségtelenül óriási segítség. Az eszközzel gyorsan ellenőrizhetővé válnak az információforrások, és pillanatok alatt feltárhatók a kapcsolatok különböző személyek, helyek, szervezetek között. Ez az információgyűjtés az (adat)újságírás legidőigényesebb része, az újságírók olykor heteket-hónapokat is eltöltenek azzal, hogy adatokat gyűjtsenek, azokat ellenőrizzék és rendszerezzék, hogy láthatóvá váljanak a köztük lévő összefüggések.

Ugyanakkor hiba lenne ezt – Tung szavaival – valamiféle Szent Grálnak tekinteni. Számtalanszor bebizonyosodott, hogy a mesterségesintelligencia-algoritmusok sem mentesek az előítéletektől. Emellett azzal is számolni kell, hogy az MI rosszul is tanítható. Mint azt a közelmúltban az intelligens asszisztensek kockázataival kapcsolatos körkérdésünkre Frész Ferenc, a Cyber Sertvices vezérigazgatója írta, a mesterséges intelligenciával és a gépi tanulással egy nagyon súlyos új támadási faktor lépett be: az adattorzítás. Ennek lényege, hogy olyan – hamis – adatokat visznek be az öntanuló algoritmusokba, melyek eredményeként az rossz-hibás válaszokat ad. Ennek hatása beláthatatlan.

Cloud & big data

Le kell-e mondani a távmunkázóknak a céges karrierről?

Ha valaki nem szeretne élete végéig a céges hierarchia alján maradni, nehéz helyzetben lesz, ha a távmunkát választja – vélik egyes szervezetfejlesztési szakértők.
 
A biztonság kiszervezéséhez komoly bizalmi tőke kell, ami lassan épül fel, de tartósabb is, mint a betyárbecsület.

a melléklet támogatója a Euro One

Hirdetés

Így érdemes kialakítani a biztonságfelügyeletet

A jó példákért nem kell messze menni. Az alábbiakban csupa magyarországi bevált gyakorlat következik.

Nem általában a távmunkáé, hanem a mostani tipikus távmunka-helyzeteké. A szervezetek arra nem voltak felkészülve, hogy mindenki otthonról dolgozik.

Alapjaiban kell megújítani a biztonságról kialakított felfogásunkat

Mi köze az IBM licencszerződések apró betűs kitételeinek ahhoz, hogy a Microsoft Windows Server 2008 életciklusának végéhez ér? Rogányi Dániel (IPR-Insights) írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2020 Bitport.hu Média Kft. Minden jog fenntartva.