Az AI21 Labs gigantikus kísérletében másfél millióan vettek részt. Az önkéntesek tetemes része nem tudott különbséget tenni gép és ember között.
Hirdetés
 

Érdekes eredményeket hozott az az egy hónapja folyó kísérlet, amelyet egy nagy nyelvi modelleket fejlesztő cég, az AI21 Labs végzett.

A Human or Not? (Ember vagy sem?) elnevezésű projekt keretében a vállalkozó kedvűeket a dedikált honlapon keresztül összepárosították egy csevegőpartnerrel, majd kétpercnyi szöveges kommunikációt követően meg kellett tippelni, hogy a partner egy húsvér ember, vagy egy algoritmus volt. A kísérlet során az algoritmusokat olyan vezető nagy nyelvi modellek képviselték, mint a ChatGPT-vel berobbant OpenAI GPT-4 algoritmusa, továbbá az AI21 Labs saját fejlesztésű bajnoka, a Jurassic-2.

A kezdeményezés meglehetősen népszerűnek bizonyult, hiszen a cég tájékoztatása szerint az április közepi indulás óta több mint 10 millió beszélgetés zajlott a platformon, összesen több mint másfél millió résztvevővel a világ minden tájáról.

Érdekes módon a projekt legalább annyira bizonyult szociológiai, mint technológiai kísérletnek. Általános tendencia volt például, hogy a kellően udvarias csevegőpartnert robotnak bélyegezték (ami meglehetősen rossz képet fest az interneten uralkodó közbeszéd állapotáról). Egyesek jól felismerhető módszerekkel igyekeztek kiugratni a nyulat a bokorból (például aktuális témákról kérdeztek), mások a szlengszavak használatából, elütésekből, helyesírási hibákból próbáltak rájönni a helyes megoldásra. Taktikájuk azonban nem feltétlenül jött be, mivel a modelleket valós adatokkal is felvértezték, valamint az emberi tökéletlenség utánzására is felkészítették.

Ami a számszerű eredményeket illeti, az első 2 millió párbeszéd alapján a résztvevők átlagosan 68 százalékos pontosságot tudtak felmutatni, azaz nagyjából harmaduk eltévedt a gép-ember útvesztőben. Az emberi beszélgetőtársakat egyébként jobban ítélték meg (73 százalékos pontosság), amikor azonban algoritmus volt "a vonal másik végén", akkor csak 60 százalékban sikerült ezt kideríteni a rövid eszmecsere alapján. Ez utóbbi arány pedig már nem sokkal jobb, mint a pénzfeldobáson alapuló döntés várható eredménye.

Azért még nem jött el a Terminátor kora

Bármennyire is meghökkentőnek tűnnek a fenti eredmények, nem érdemes ezekből levonni azt a következtetést, hogy az algoritmusok már ott tartanak, hogy gond nélkül képesek lennének beolvadni az emberi kommunikációba. Már csak azért sem, mivel ahogy az Eugene Goostman elnevezésű chatbot sok évvel ezelőtti, hangos szalagcímekkel kísért performansza sem követte szigorúan Alan Turing matematikus híres, még az 1950-es években felállított kísérleti modelljét, úgy a mostani projekt is csak egyfajta lebutított változatnak tekinthető.

Arról nem is beszélve, hogy magát az eredeti Turing-tesztet is sok kritika érte. Tudósok garmadája ásta már alá a koncepciót, és mutatta ki, hogy az ilyen kísérletek egyáltalán nem alkalmasak arra, hogy a gépi intelligencia "emberivé" válásának zsinórmértékei legyenek.

Ettől függetlenül arra mindenképpen jó volt ez a grandiózus kísérlet, hogy rámutasson arra, mennyire halvány már a határvonal, amelyet az emberi megérzés képes felrajzolni egy ilyen helyzetben. Ráadásul ez a vonal az algoritmusok fejlődésével egyre csak halványabbá válik.

Cloud & big data

Máris megszűnik a ChatGPT automata modellválasztója az ingyenes felhasználásban

Nemcsak drága, hanem az OpenAi szerint nem is népszerű, így a bonyolultabb kérdésekre adott pontosabb válaszokhoz ismét manuális modellválasztásra lesz szükség.
 
Hirdetés

Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai

Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.

Sok szervezet adatvezéreltnek tartja magát, mert van BI rendszere és heti dashboardja. A valóságban azonban ennél többről van szó; a kérdés ugyanis nem az, hogy van-e elég adat, hanem, hogy mennyire jól használják a döntések meghozatalához.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.