Lehullott a lepel: elismerte az Anthropic, hogy tényleg butább lett a Claude

Bitport2026.04.24.Cloud & big data

A cég nagy nyelvi modelljének képességbeli hanyatlására többen panaszkodtak mostanában. Kiderült, hogy nem hallucináltak: elhibázott fejlesztések és bugok "összjátéka" okozta a nem kívánt hatást.

Csütörtökön közzétett blogbejegyzésében az Anthropic elsimerte és egyben meg is magyarázta, miért érezhették a felhasználók a közelmúltban azt, hogy a cég által fejlesztett Claude nagy nyelvi modell a korábban megszokottnál kicsit gyengébb teljesítményt nyújt.

Az időközben lefolytatott belső vizsgálat alapján az ügyfélpanaszoknak volt igazságalapjuk: március és április folyamán három olyan egymással nem összefüggő változtatást is eszközöltek, amelyektől a szolgáltatások nem előre mentek, hanem hátra. A romlást a Claude Code, a Claude Agent SDK és a Claude Cowork felhasználói érzékelhették, ugyanakkor az Anthropic szerint a Claude API-ja zavartalanul működött.

Három a mesterséges igazság

Az első hiba egy stratégia döntésből született még március 4-én született. Ekkor a cégnél tudatosan lejjebb tekerték Claude Code alapértelmezett gondolkodási intenzitását (reasoning effort), amivel a modell válaszadási sebességét (latency) igyekeztek javítani. Ez azonban túlságosan sokat rontott a válaszok minőségén, így felhasználói visszajelzések alapján pár napon belül, április 7-én visszaállították az eredeti, magasabb szintet.

Március végén érkezett a következő csapás, amit abból lehetett észrevenni, hogy a chatbot elkezdte elveszteni a (téma)fonalat és rendszeresen ismételte magát. Mint kiderült, ezt gyorsítótárazási (caching) hiba okozta, amit egy nem teljesen a tervek szerint működő frissítés okozott. Memóriaoptimalizáció ürügyén az egy óránál régebbi munkameneteknél akarták kitisztítani az algoritmus gondolatmenetét, ám egy hiba miatt ezt minden lépésnél megtette a modell.

A harmadik problémát egy április közepén életbe léptetett rendszerszintű módosítás okozta, amely szigorú korlátokat szabott a válaszok hosszának. Ezzel a mérnökök célja a modellek fecsegésének (verbosity) visszafogása volt, ám a tömörségre kényszere annyival rontotta a bonyolult kódolási feladatok megoldási hatékonyságát, hogy ezt a változtatást is vissza kellett vonni néhány nap múlva.

Szánják és bánják

Az Anthropic a hibák feltárásával párhuzamosan elnézést kért az ügyfelektől. A cég ígéretett tett arra is, hogy a hasonló esetek elkerülése érdkeében felülvizsgálják a most sorozatban csődött mondó belső tesztelési folyamataikat és automatizált értékelési rendszerüket. A kelleténél butább modellekkel való csevegések kárpótlásaként pedig minden érintett felhasználónál alaphelyzetbe állították a fiókhoz tartozó használati limiteket.

Cloud & big data

Alaposan kitömi az Nvidia az OpenAI lelépett társalapítójának MI-cégét

A Safe Superintelligence több milliárd dollár értékű megállapodást kötött az Nvidiával, amivel biztosítaná, hogy piaci nyomás nélkül dolgozhasson a biztonságos szuperintelligencia magasabb szintű technikai megoldásain.

Hirdetés

Öt kérdés, amelyet érdemes feltenni felhőplatform-választás előtt

Egy felhőplatform értékét nemcsak a szolgáltatásai határozzák meg, hanem az is, hogy egy kritikus helyzetben mennyire képes támogatni a vállalat működését.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Alaposan kitömi az Nvidia az OpenAI lelépett társalapítójának MI-cégét

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!