Gigantikus szuperagy lesz az internet következő keresője?

Bitport2021.05.19.Cloud & big data

Keresni olyan lesz, mintha egy mindentudó könyvtárossal beszélgetnénk. De nem borítja fel, hanem megerősíti a világ rendjét, mert ezen is a Google dolgozik.

Több mint 20 éve megjelent egy cikk a Computer Networksben, amely egy új típusú keresőmotor működési elvét mutatta be. A cikket a Stanford két diákja jegyezte: Segey Brin és Larry Page. A szerzők azt ígérték, hogy keresőjük minden korábbi motornál hatékonyabban térképezi fel a internetet, hogy az online térben információt keresőknek releváns találatokat adjanak (a cikk itt érhető el PDF-ben).

Az ötleten épült fel a Google, és azóta is működik a Brin-Page páros PageRank nevű csodafegyvere, amely segít rangsorolni a felhasználó kérése szempontjából releváns oldalakat, tartalmakat.

Itt a folytatás – a Google-től

A közelmúltban azonban felmerült egy radikális újítási javaslat – írja a MIT Technology Review. Egy csapata a hipertexuális kapcsolatok vizsgálata helyett csupán egy mesterségesintelligencia-alapú nyelvi modellt használna mint Google BERT-je – amit egyébként a Google tavaly óta hivatalosan is használ a PageRank találtatainak pontosításához – vagy az OpenAI híres-hírhedt GPT-3-ja. A történet pikantériája, hogy az ötletet a Google Research kutatói publikálták az arXiv-on egy a szakirodalmi jegyzékkel együtt 12 oldalas tanulmányban [PDF].

Az elképzelés szerint az MI-alapú kereső is úgy működne mint egy rendkívül tájékozott könyvtáros: a felhasználó kérdéseket tesz fel neki, az MI pedig válaszol, ahogy teszi most például a digitális asszisztens is. Csak itt a válasz egy találati lista, ahogy a könyvtáros is sokszor csak orientál, ha a kérdés sem válaszolható meg egzaktul. A kutatók szerint a keresőmotorok az MI révén sokkal gyorsabbá válhatnak, és nem fog számukra nehézséget okozni az internetes információk robbanásszerű növekedése.

A Google-tanulmány egyik szerzője, Donald Metzler szerint az elmúlt húsz évben azért nem volt szükség a keresés újragondolására, mert az alaplogika (robotok indexelik az weblapokat, az algoritmusok rangsorolnak, és ez alapján jelenítenek meg találatot a felhasználónak) tökéletesen kielégítette az internetezők igényeit. Ma viszont a felhasználók nem listákat akarnak, hanem válaszokat a kérdéseikre. A jelenlegi technikák azonban arra már nem képesek, hogy több forrásból szintetizáljanak releváns választ. Metzler szerint ez olyan, mintha valaki egy hosszú olvasmányjegyzéket kapna az orvosától, akitől csupán tanácsot kért.

Ez lenne a internet szuperagya?

Metzlerék viszont a virtuális "orvost" szeretnék előállítani, amely több forrást feldolgozva természetes nyelven adja meg a kérdésre a választ, és összegyűjti azokat a hivatkozásokat, melyekből a választ szintetizálta. A leghatékonyabb MI-modellekkel – a GPT-3-mal is – egyelőre az a baj, hogy nem tartják nyilván a feldogozott forrásokat, így nem is ellenőrizhető, hogy megbízható információkat ad, vagy csak saját maga gyártotta hülyeségeket locsog.

A kutatók szerint itt lehetne megfogni a problémát: a jövőben a természetes nyelvi MI algoritmusokat úgy kellene tanítani, hogy a válaszoknál azt is ellenőrizni lehessen, milyen forrásokból dolgozott.

Egy brit kutató szerint a Google elképzelésében az az újdonság, hogy egyesítene minden olyan törekvést, ami eddig az internetes információk keresése kapcsán felmerült: képes lenne konkrét kérdésekre választ adni, több dokumentumot összefoglalni, információhalmazokat strukturálni. Ha jól belegondolunk, akkor Donald Metzlerék egy közepesen kreatív, de végtelen memóriával rendelkező szuperagyat képzelnek el, ami minden kérdésre tudja a választ – amire az interneten megvan a válasz.

Ugyanakkor itt hatványozottan merül fel az előítéletes tanítás problémája. Az például, hogy a nyelvi modellek elsősorban az angol nyelvhez készülnek (kivéve, amiket Kínában fejlesztenek, de rajtunk, bábeli világban élő európaiakon azok sem segítenek). Másrészt a tudás univerzalitása is sérül: míg például e-kereskedelemről számolatlanul sorakoznak a neten az információk, míg a kvantummechanikáról sokkal kevesebb valóban releváns szöveget találunk.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hamarosan robotaxik tudhatják le az Uber-fuvarokat

A fuvarozó cég a tervek szerint az elektromos autókat gyártó Lucid és az önvezető rendszereket fejlesztő Nuro segítségével érné el azt, aminek önálló megvalósításáról még 2020-ban tett le.

A hónap témája

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.

CIO Podcast

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hamarosan robotaxik tudhatják le az Uber-fuvarokat

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2025 konferencia