Csuklóból hozta a Turing-tesztet az OpenAI egyik modellje

Bitport2025.04.03.Közösség & HR

Állítólag ez az első eset, hogy gyakorlati bizonyítékot szolgáltatnak egy gép sikeres Turing-tesztjére, bár az intelligencia megfejtéséhez ettől még nem jutottunk sokkal közelebb.

A matematikus Alan Turing 75 évvel ezelőtti felvetése szerint egy gép akkor tekinthető intelligensnek, ha képes teljesíteni egy egyszerű tesztet. Egy emberi bíráló 5 percen keresztül írott formában beszélget két, általa nem ismert tesztalannyal, akik közül az egyik szintén ember, a másik pedig a szóban forgó gép. Ezek mindketten arról próbálják meggyőzni, hogy ők a gondolkodó emberek, és ha a kérdezőnek ennyi idő alatt sem sikerül egyértelműen megállapítania, hogy ki kicsoda, akkor a gép kiállta a próbát.

A "mezitlábas" Turing-teszt természetesen inkább gondolatkísérlet, mint tényleges minősítő eljárás, hiszen a párbeszéd sikeres szimulációjából még nem következik, hogy az alany intelligens, mint ahogy az emberi kommunikáció képessége sem az intelligencia feltétele. Ugyanígy elmondható, hogy a Turing-teszten a gyerekek, a fogyatékkal élők vagy a nem együttműködő emberek is megbukhatnak, sőt az együttműködést a gépek esetében sem vehetjük készpénznek. A mesterséges intelligencia jelenlegi fejlettségi szintjén ráadásul egyre nehezebb lesz olyasmit kérdezni a robotoktól, amire ne tudnának hihető választ adni a képzésük során feldolgozott adatok és minták felhasználásával, ennek ellenére még a legfejlettebb MI-modelleket is nehéz lenne a szó eredeti értelmében intelligensnek tekinteni.

Mindezek ellenére Alan Turing koncepciója elválaszthatatlanná vált a mesterséges intelligencia fejlesztésétől. Így annak is hírértéke van, hogy a San Diegó-i Kaliforniai Egyetem kutatói közölték: első ízben szereztek empirikus bizonyítékot arra vonatkozóan, hogy egy MI-rendszer képes volt átmenni egy szabványos, háromrésztvevős Turing-teszten. Közel 300 résztvevővel levezényelt kísérleteik során ugyanis az OpenAI GPT-4.5 modelljét az esetek 73 százalékában fogadták el valódi embernek.

Abban bíznak, hogy mi is fejlődünk

A dolog érdekessége, hogy amikor a modell csak azt a parancsot kapta, hogy egy Turing-teszt során győzze meg a kérdezőt emberi mivoltáról, akkor mindössze 36 százalékban volt sikeres. Ezzel szemben amikor az utasítást azzal is kiegészítették, hogy a kísérlet során vegyen fel egy meghatározott személyiséget, több mint kétszeresére javult a hatékonysága. Ezek az eredmények egyfelől lenyűgözőek, másfelől persze kérdés, hogy következik-e belőlük bármi: eddig sem volt titok, hogy az MI-chatbotok egyre jobb beszélgetőpartnerek, de saját erőből már egy mutatós óra számlapjának leolvasása is megoldhatatlan feladat elé állítja őket.

A nagy nyelvi modellek (LLM-ek) intelligenciájának vizsgálatát a mostani kutatás szerzői is nagyon bonyolult kérdésnek tartják, és eredményeiket a sok egyéb szükséges bizonyíték közé helyezik el. Sokkal fontosabbnak tartják azonban, hogy mindezek alapján az LLM-ek a rövid interakciók során már bárkit képesek lehetnek átverni az azonosságukat illetően, különféle alkalmazásaik pedig ebből adódóan "még több társadalmi zavarhoz" vezethetnek. Azért a kutatás vezetője szerint érdemes figyelembe venni, hogy a Turing-teszt nemcsak a gépeket vizsgálja, hanem közvetett módon az emberek folyamatosan fejlődő érzékét is tükrözi a technológiával kapcsolatban. Vagyis ahogy egyre megszokottabbá válik az MI-eszközökkel való interakció, úgy tanulhatjuk majd meg egyre jobban "kiszimatolni" a gépi intelligenciát.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

Nem szűnt meg, csak profilt váltott a hírhedt hekkerbanda

A zsarolóvírusos támadásokban utazó Hunters International tavaly novemberben jelentette be megszűnését, de mint kiderült, az online rablók csak profilt váltottak.

A hónap témája

Hol tart a digitális átalakulás Európában és Magyarországon?

Körképünkben áttekintjük, hogy szűkebb és bővebb környezetünkben mit sikerült elérni a digitális gazdaság és életvitel felé vezető úton. Spolier: nem állunk olyan rosszul, mint gondolná, és nem állunk olyan jól, mint szeretné.

a melléklet támogatója a One Solutions

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

CIO Podcast

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Nem szűnt meg, csak profilt váltott a hírhedt hekkerbanda

Hol tart a digitális átalakulás Európában és Magyarországon?

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2025 konferencia