Az AI21 Labs gigantikus kísérletében másfél millióan vettek részt. Az önkéntesek tetemes része nem tudott különbséget tenni gép és ember között.
Hirdetés
 

Érdekes eredményeket hozott az az egy hónapja folyó kísérlet, amelyet egy nagy nyelvi modelleket fejlesztő cég, az AI21 Labs végzett.

A Human or Not? (Ember vagy sem?) elnevezésű projekt keretében a vállalkozó kedvűeket a dedikált honlapon keresztül összepárosították egy csevegőpartnerrel, majd kétpercnyi szöveges kommunikációt követően meg kellett tippelni, hogy a partner egy húsvér ember, vagy egy algoritmus volt. A kísérlet során az algoritmusokat olyan vezető nagy nyelvi modellek képviselték, mint a ChatGPT-vel berobbant OpenAI GPT-4 algoritmusa, továbbá az AI21 Labs saját fejlesztésű bajnoka, a Jurassic-2.

A kezdeményezés meglehetősen népszerűnek bizonyult, hiszen a cég tájékoztatása szerint az április közepi indulás óta több mint 10 millió beszélgetés zajlott a platformon, összesen több mint másfél millió résztvevővel a világ minden tájáról.

Érdekes módon a projekt legalább annyira bizonyult szociológiai, mint technológiai kísérletnek. Általános tendencia volt például, hogy a kellően udvarias csevegőpartnert robotnak bélyegezték (ami meglehetősen rossz képet fest az interneten uralkodó közbeszéd állapotáról). Egyesek jól felismerhető módszerekkel igyekeztek kiugratni a nyulat a bokorból (például aktuális témákról kérdeztek), mások a szlengszavak használatából, elütésekből, helyesírási hibákból próbáltak rájönni a helyes megoldásra. Taktikájuk azonban nem feltétlenül jött be, mivel a modelleket valós adatokkal is felvértezték, valamint az emberi tökéletlenség utánzására is felkészítették.

Ami a számszerű eredményeket illeti, az első 2 millió párbeszéd alapján a résztvevők átlagosan 68 százalékos pontosságot tudtak felmutatni, azaz nagyjából harmaduk eltévedt a gép-ember útvesztőben. Az emberi beszélgetőtársakat egyébként jobban ítélték meg (73 százalékos pontosság), amikor azonban algoritmus volt "a vonal másik végén", akkor csak 60 százalékban sikerült ezt kideríteni a rövid eszmecsere alapján. Ez utóbbi arány pedig már nem sokkal jobb, mint a pénzfeldobáson alapuló döntés várható eredménye.

Azért még nem jött el a Terminátor kora

Bármennyire is meghökkentőnek tűnnek a fenti eredmények, nem érdemes ezekből levonni azt a következtetést, hogy az algoritmusok már ott tartanak, hogy gond nélkül képesek lennének beolvadni az emberi kommunikációba. Már csak azért sem, mivel ahogy az Eugene Goostman elnevezésű chatbot sok évvel ezelőtti, hangos szalagcímekkel kísért performansza sem követte szigorúan Alan Turing matematikus híres, még az 1950-es években felállított kísérleti modelljét, úgy a mostani projekt is csak egyfajta lebutított változatnak tekinthető.

Arról nem is beszélve, hogy magát az eredeti Turing-tesztet is sok kritika érte. Tudósok garmadája ásta már alá a koncepciót, és mutatta ki, hogy az ilyen kísérletek egyáltalán nem alkalmasak arra, hogy a gépi intelligencia "emberivé" válásának zsinórmértékei legyenek.

Ettől függetlenül arra mindenképpen jó volt ez a grandiózus kísérlet, hogy rámutasson arra, mennyire halvány már a határvonal, amelyet az emberi megérzés képes felrajzolni egy ilyen helyzetben. Ráadásul ez a vonal az algoritmusok fejlődésével egyre csak halványabbá válik.

Cloud & big data

A társasjátékosok nagyon nem szívlelik az MI-t

Az egyik nagy múltú kiadó vezetője arról írt, hogy az algoritmusokkal már most össze tudna dobatni olyan egyszerűbb társasjátékokat, mint amilyeneket a cége is forgalmaz. Néhány órán belül menesztették.
 
Hirdetés

Produktivitás mint stratégiai előny: mit csinálnak másként a sikeres cégek?

A META-INF által szervezett Productivity Day 2026 idén a mesterséges intelligencia és a vállalati produktivitás kapcsolatát helyezi fókuszba. Az esemény középpontjában a META-INF nagyszabású produktivitási kutatásának bemutatása áll, amely átfogó képet nyújt a magyar vállalatok hatékonyságáról és működési kihívásairól.

Vezetői példamutatás és megfelelő oktatás, vállalatikultúra-váltás nélkül gyakorlatilag lehetetlen adatvezérelt működést bevezetni. Cikkünk nemcsak a buktatókról, hanem azok elkerülésének módjairól is szól.

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.