Újabb egyszerű kísérlettel mutatták be, hogy a legfejlettebb MI-modellek érvelési képességei egyből elfüstölnek, ha ismeretlen terepen találják magukat.
Hirdetés
 

Bár az OpenAI vezérigazgatója, Sam Altman szerint a vállalat már világosan látja az emberi képességeket tükröző vagy azokat túl is haladó mesterséges általános intelligencia (AGI) felépítéséhez vezető utat, a gyakorlati tapasztalatok egyelőre nem sokban támasztják alá a befektetőknek szóló sikerpropagandát. Sorra jelennek meg a kutatások azzal kapcsolatban, hogy a legkifinomultabbnak mondott nagy nyelvi modellek (LLM) is elhasalnak az egyszerű, általunk könnyen megoldható logikai feladványokon, beleértve az OpenAI legújabb, emberszerű következtetési képességekkel jellemzett o1 modelljét is.

A kritikusok szerint az iparág vezető szereplőinek magas értékelése nagyrészt azon a téves elképzelésen alapul, hogy az LLM-ek teljesítménye a méretezéstől függően korlátlanul fejleszthető. Bár ennek korlátai egyre nyilvánvalóbbá válnak, az MI-cégek folyamatosan keresik (és állításuk szerint meg is találják) a megoldást a problémára, amire feltétlenül szükségük lenne a modellek gazdaságossá tételéhez és saját működésük nyereségessé válásához is. Az AGI megalkotása viszont még ennél is távolibbnak tűnik, legalábbis ha tényleg az emberi képességek másolása a cél, és nem a hatékony céleszközök létrehozása.

Szép, szép, de asztalnál meghalna

A Walter Bradley Center for Natural and Artificial Intelligence vezető munkatársa, Gary Smith néhány nappal ezelőtt tette közzé egy érdekes kísérlet eredményét, amelynek során az OpenAI o1, illetve a Google Gemini 2.0 Flash, a Microsoft Bing Copilot (GPT 4) és az Anthropic Claude megoldásait eresztette rá a New York Times felkapott Connections játékára. Ebben hogy 16 szót kell négyes csoportokra osztani valamilyen közös, kézenfekvő vagy nagyon is elvont jellemzőjük alapján – a rejtvény pedig akármilyen trükkös, a népszerűségét nyilván nem annak köszönheti, hogy csak akadémikusoknak érdemes játszaniuk vele.

Smith szerint a fenti modellek mindegyike kudarcot vallott kudarcot vallott: bár voltak jó megoldásaik is, a többi megfejtésük "a bizarrság határán" billegett, ahogy egymáshoz nem illő szavakat párosítottak egymással képtelen indoklások mellett. Ahogy a kommentárok megjegyzik, ez különösen kellemetlen az o1 esetében, amelynek éppen az ilyen irányú képességei miatt kellene kiemelkednie a mezőnyből. A Mind Matters oldalán közölt bejegyzés pedig ismét rávilágít, hogy a jelenlegi MI-technológiák teljesítményét a képzési adatok határozzák meg, de a szó tényleges értelmében cseppet sem intelligensek.

Eközben a nagy techvállalatok vezetői rendszeresen a tűz vagy a kerék felfedezéséhez hasonlítják az MI jelentőségét, és már erre az évre megjósolták az AGI bemutatkozását. Smith véleménye szerint abban nincs okunk kételkedni, hogy a nagy nyelvi modellek kimenetei a jövőben is folyamatos, szerény javulást mutatnak majd a humán trénerek munkájának köszönhetően. Megérteni azonban továbbra sem fognak semmit, a feldolgozott adattömegben megjelenő statisztikai minták azonosítása pedig nem vezet el sem a mesterséges általános intelligencia, sem a sokat emlegetett "szuperintelligencia" megszületéséhez.

Cloud & big data

2027-ben indulhat a digitális euró tesztje

Az Európai Központi Bank Kormányzótanácsának digitális euróért felelős tagja azt is elmondta, hogy mennyibe kerül az egységes digitális pénz bevezetése a bankoknak.
 
Hirdetés

Produktivitás mint stratégiai előny: mit csinálnak másként a sikeres cégek?

A META-INF által szervezett Productivity Day 2026 idén a mesterséges intelligencia és a vállalati produktivitás kapcsolatát helyezi fókuszba. Az esemény középpontjában a META-INF nagyszabású produktivitási kutatásának bemutatása áll, amely átfogó képet nyújt a magyar vállalatok hatékonyságáról és működési kihívásairól.

Vezetői példamutatás és megfelelő oktatás, vállalatikultúra-váltás nélkül gyakorlatilag lehetetlen adatvezérelt működést bevezetni. Cikkünk nemcsak a buktatókról, hanem azok elkerülésének módjairól is szól.

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.