A cég nagy nyelvi modelljének képességbeli hanyatlására többen panaszkodtak mostanában. Kiderült, hogy nem hallucináltak: elhibázott fejlesztések és bugok "összjátéka" okozta a nem kívánt hatást.

Csütörtökön közzétett blogbejegyzésében az Anthropic elsimerte és egyben meg is magyarázta, miért érezhették a felhasználók a közelmúltban azt, hogy a cég által fejlesztett Claude nagy nyelvi modell a korábban megszokottnál kicsit gyengébb teljesítményt nyújt.

Az időközben lefolytatott belső vizsgálat alapján az ügyfélpanaszoknak volt igazságalapjuk: március és április folyamán három olyan egymással nem összefüggő változtatást is eszközöltek, amelyektől a szolgáltatások nem előre mentek, hanem hátra. A romlást a Claude Code, a Claude Agent SDK és a Claude Cowork felhasználói érzékelhették, ugyanakkor az Anthropic szerint a Claude API-ja zavartalanul működött.

Három a mesterséges igazság

Az első hiba egy stratégia döntésből született még március 4-én született. Ekkor a cégnél tudatosan lejjebb tekerték Claude Code alapértelmezett gondolkodási intenzitását (reasoning effort), amivel a modell válaszadási sebességét (latency) igyekeztek javítani. Ez azonban túlságosan sokat rontott a válaszok minőségén, így felhasználói visszajelzések alapján pár napon belül, április 7-én visszaállították az eredeti, magasabb szintet.

Március végén érkezett a következő csapás, amit abból lehetett észrevenni, hogy a chatbot elkezdte elveszteni a (téma)fonalat és rendszeresen ismételte magát. Mint kiderült, ezt gyorsítótárazási (caching) hiba okozta, amit egy nem teljesen a tervek szerint működő frissítés okozott. Memóriaoptimalizáció ürügyén az egy óránál régebbi munkameneteknél akarták kitisztítani az algoritmus gondolatmenetét, ám egy hiba miatt ezt minden lépésnél megtette a modell.

A harmadik problémát egy április közepén életbe léptetett rendszerszintű módosítás okozta, amely szigorú korlátokat szabott a válaszok hosszának. Ezzel a mérnökök célja a modellek fecsegésének (verbosity) visszafogása volt, ám a tömörségre kényszere annyival rontotta a bonyolult kódolási feladatok megoldási hatékonyságát, hogy ezt a változtatást is vissza kellett vonni néhány nap múlva.

Szánják és bánják

Az Anthropic a hibák feltárásával párhuzamosan elnézést kért az ügyfelektől. A cég ígéretett tett arra is, hogy a hasonló esetek elkerülése érdkeében felülvizsgálják a most sorozatban csődött mondó belső tesztelési folyamataikat és automatizált értékelési rendszerüket. A kelleténél butább modellekkel való csevegések kárpótlásaként pedig minden érintett felhasználónál alaphelyzetbe állították a fiókhoz tartozó használati limiteket.

Cloud & big data

Milliárdnyi ember elől ihatja el a vizet a mesterséges intelligencia

Az ENSZ egyik szervezetének friss jelentése olyan óriási energia-, víz- és földterület-felhasználásra figyelmeztet, ami súlyos környezeti és méltányossági kihívásokat vet fel a globális MI-infrastruktúrát illetően.
 
Hirdetés

Szintet lép a Synology: Érkezik a PAS7700 csúcskategóriás vállalati flash tároló

Ahogy a vállalati IT-környezetek az AI-alapú folyamatok, a virtualizáció, a nagy teljesítményű adatbázisok és a folyamatosan elérhető digitális szolgáltatások nyomása alatt fejlődnek, a szervezetek egyre inkább olyan tárolóinfrastruktúrát igényelnek, amely kompromisszumok nélküli teljesítményt, rugalmasságot és skálázhatóságot biztosít.

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.
Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.