A matematikus Alan Turing 75 évvel ezelőtti felvetése szerint egy gép akkor tekinthető intelligensnek, ha képes teljesíteni egy egyszerű tesztet. Egy emberi bíráló 5 percen keresztül írott formában beszélget két, általa nem ismert tesztalannyal, akik közül az egyik szintén ember, a másik pedig a szóban forgó gép. Ezek mindketten arról próbálják meggyőzni, hogy ők a gondolkodó emberek, és ha a kérdezőnek ennyi idő alatt sem sikerül egyértelműen megállapítania, hogy ki kicsoda, akkor a gép kiállta a próbát.
A "mezitlábas" Turing-teszt természetesen inkább gondolatkísérlet, mint tényleges minősítő eljárás, hiszen a párbeszéd sikeres szimulációjából még nem következik, hogy az alany intelligens, mint ahogy az emberi kommunikáció képessége sem az intelligencia feltétele. Ugyanígy elmondható, hogy a Turing-teszten a gyerekek, a fogyatékkal élők vagy a nem együttműködő emberek is megbukhatnak, sőt az együttműködést a gépek esetében sem vehetjük készpénznek. A mesterséges intelligencia jelenlegi fejlettségi szintjén ráadásul egyre nehezebb lesz olyasmit kérdezni a robotoktól, amire ne tudnának hihető választ adni a képzésük során feldolgozott adatok és minták felhasználásával, ennek ellenére még a legfejlettebb MI-modelleket is nehéz lenne a szó eredeti értelmében intelligensnek tekinteni.
Mindezek ellenére Alan Turing koncepciója elválaszthatatlanná vált a mesterséges intelligencia fejlesztésétől. Így annak is hírértéke van, hogy a San Diegó-i Kaliforniai Egyetem kutatói közölték: első ízben szereztek empirikus bizonyítékot arra vonatkozóan, hogy egy MI-rendszer képes volt átmenni egy szabványos, háromrésztvevős Turing-teszten. Közel 300 résztvevővel levezényelt kísérleteik során ugyanis az OpenAI GPT-4.5 modelljét az esetek 73 százalékában fogadták el valódi embernek.
Abban bíznak, hogy mi is fejlődünk
A dolog érdekessége, hogy amikor a modell csak azt a parancsot kapta, hogy egy Turing-teszt során győzze meg a kérdezőt emberi mivoltáról, akkor mindössze 36 százalékban volt sikeres. Ezzel szemben amikor az utasítást azzal is kiegészítették, hogy a kísérlet során vegyen fel egy meghatározott személyiséget, több mint kétszeresére javult a hatékonysága. Ezek az eredmények egyfelől lenyűgözőek, másfelől persze kérdés, hogy következik-e belőlük bármi: eddig sem volt titok, hogy az MI-chatbotok egyre jobb beszélgetőpartnerek, de saját erőből már egy mutatós óra számlapjának leolvasása is megoldhatatlan feladat elé állítja őket.
A nagy nyelvi modellek (LLM-ek) intelligenciájának vizsgálatát a mostani kutatás szerzői is nagyon bonyolult kérdésnek tartják, és eredményeiket a sok egyéb szükséges bizonyíték közé helyezik el. Sokkal fontosabbnak tartják azonban, hogy mindezek alapján az LLM-ek a rövid interakciók során már bárkit képesek lehetnek átverni az azonosságukat illetően, különféle alkalmazásaik pedig ebből adódóan "még több társadalmi zavarhoz" vezethetnek. Azért a kutatás vezetője szerint érdemes figyelembe venni, hogy a Turing-teszt nemcsak a gépeket vizsgálja, hanem közvetett módon az emberek folyamatosan fejlődő érzékét is tükrözi a technológiával kapcsolatban. Vagyis ahogy egyre megszokottabbá válik az MI-eszközökkel való interakció, úgy tanulhatjuk majd meg egyre jobban "kiszimatolni" a gépi intelligenciát.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak