Keresni olyan lesz, mintha egy mindentudó könyvtárossal beszélgetnénk. De nem borítja fel, hanem megerősíti a világ rendjét, mert ezen is a Google dolgozik.

Több mint 20 éve megjelent egy cikk a Computer Networksben, amely egy új típusú keresőmotor működési elvét mutatta be. A cikket a Stanford két diákja jegyezte: Segey Brin és Larry Page. A szerzők azt ígérték, hogy keresőjük minden korábbi motornál hatékonyabban térképezi fel a internetet, hogy az online térben információt keresőknek releváns találatokat adjanak (a cikk itt érhető el PDF-ben).

Az ötleten épült fel a Google, és azóta is működik a Brin-Page páros PageRank nevű csodafegyvere, amely segít rangsorolni a felhasználó kérése szempontjából releváns oldalakat, tartalmakat.

Itt a folytatás – a Google-től

A közelmúltban azonban felmerült egy radikális újítási javaslat – írja a MIT Technology Review. Egy csapata a hipertexuális kapcsolatok vizsgálata helyett csupán egy mesterségesintelligencia-alapú nyelvi modellt használna mint Google BERT-je – amit egyébként a Google tavaly óta hivatalosan is használ a PageRank találtatainak pontosításához – vagy az OpenAI híres-hírhedt GPT-3-ja. A történet pikantériája, hogy az ötletet a Google Research kutatói publikálták az arXiv-on egy a szakirodalmi jegyzékkel együtt 12 oldalas tanulmányban [PDF].

Az elképzelés szerint az MI-alapú kereső is úgy működne mint egy rendkívül tájékozott könyvtáros: a felhasználó kérdéseket tesz fel neki, az MI pedig válaszol, ahogy teszi most például a digitális asszisztens is. Csak itt a válasz egy találati lista, ahogy a könyvtáros is sokszor csak orientál, ha a kérdés sem válaszolható meg egzaktul. A kutatók szerint a keresőmotorok az MI révén sokkal gyorsabbá válhatnak, és nem fog számukra nehézséget okozni az internetes információk robbanásszerű növekedése.

A Google-tanulmány egyik szerzője, Donald Metzler szerint az elmúlt húsz évben azért nem volt szükség a keresés újragondolására, mert az alaplogika (robotok indexelik az weblapokat, az algoritmusok rangsorolnak, és ez alapján jelenítenek meg találatot a felhasználónak) tökéletesen kielégítette az internetezők igényeit. Ma viszont a felhasználók nem listákat akarnak, hanem válaszokat a kérdéseikre. A jelenlegi technikák azonban arra már nem képesek, hogy több forrásból szintetizáljanak releváns választ. Metzler szerint ez olyan, mintha valaki egy hosszú olvasmányjegyzéket kapna az orvosától, akitől csupán tanácsot kért.

Ez lenne a internet szuperagya?

Metzlerék viszont a virtuális "orvost" szeretnék előállítani, amely több forrást feldolgozva természetes nyelven adja meg a kérdésre a választ, és összegyűjti azokat a hivatkozásokat, melyekből a választ szintetizálta. A leghatékonyabb MI-modellekkel – a GPT-3-mal is – egyelőre az a baj, hogy nem tartják nyilván a feldogozott forrásokat, így nem is ellenőrizhető, hogy megbízható információkat ad, vagy csak saját maga gyártotta hülyeségeket locsog.

A kutatók szerint itt lehetne megfogni a problémát: a jövőben a természetes nyelvi MI algoritmusokat úgy kellene tanítani, hogy a válaszoknál azt is ellenőrizni lehessen, milyen forrásokból dolgozott.

Egy brit kutató szerint a Google elképzelésében az az újdonság, hogy egyesítene minden olyan törekvést, ami eddig az internetes információk keresése kapcsán felmerült: képes lenne konkrét kérdésekre választ adni, több dokumentumot összefoglalni, információhalmazokat strukturálni. Ha jól belegondolunk, akkor Donald Metzlerék egy közepesen kreatív, de végtelen memóriával rendelkező szuperagyat képzelnek el, ami minden kérdésre tudja a választ – amire az interneten megvan a válasz.

Ugyanakkor itt hatványozottan merül fel az előítéletes tanítás problémája. Az például, hogy a nyelvi modellek elsősorban az angol nyelvhez készülnek (kivéve, amiket Kínában fejlesztenek, de rajtunk, bábeli világban élő európaiakon azok sem segítenek). Másrészt a tudás univerzalitása is sérül: míg például e-kereskedelemről számolatlanul sorakoznak a neten az információk, míg a kvantummechanikáról sokkal kevesebb valóban releváns szöveget találunk.

Cloud & big data

355 milliárd dollárt költ fejlesztésre a Samsung

A dél-koreai vállalat öt év alatt tervezi a hatalmas összeg elköltését, amelynek két fókuszpontja a csipgyártás és a biofarmácia.
 
Veszélyek garmadája bújik meg a webes alkalmazások és az alkalmazásprogramozási interfészek közötti forgalomban. Ezek kiszűrésére és hatástalanítására szerencsére egyre hatékonyabb eszközökkel rendelkezünk.

a melléklet támogatója a Balasys

A Világgazdasági Fórum figyelmeztetése szerint jelentős szakadék tátong a C-szintű vezetők és az információbiztonságért felelős részlegek helyzetértékelése között.

A járvány üzleti vezetőt csinált a CIO-kból

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.