
Új verziót adott ki Opus modelljéből az Athropic. Habár a cég közleménye hosszasan részletezi az Opus 4.6 előnyeit, a lényeg néhány szóban összefoglalható: mindenben szempontból jobb, mint az előző verzió, és talán a legjobb a konkurensei között.
És van még egy fontos üzenet: a legokosabb Opus, melyet már elérhetővé is tettek a főbb felhős platformokon és API-jain keresztül, nem lett drágább az előző verziónál. Ráadásul segít takarékoskodni. Adaptív gondolkodásának köszönhetően a kontextuális jelekből képes érzékeli, hogy milyen mértékben kell használnia a kiterjesztett gondolkodásmódját, de maguk a fejlesztők is jobb eszközöket kaptak ahhoz, hogy az elérendő célhoz optimalizálhassák az intelligenciát, a sebességet – és a költségeket.
Az Opus 4.6 minden szempontból gondosabban kódol, mint elődei. Ezt valószínűleg nehéz is lenne cáfolni. Mindazonáltal a mindennapi tapasztalatok tükrében van némi pikantériája annak, ahogyan ezt a fejlődést a cég magyarázza: "Claude-ot Claude-dal építünk" – írják az új verzió ismertetőjében. Kérdés, hogy ez megnyugtató vagy inkább riasztó az Opus használóinak.
Az Anthropic vezetése abszolút optimista. "Azt hiszem, most már szinte teljesen átállunk a vibe munkára" – nyilatkozta Scott White vállalati termékekért felelős vezető a CNBC-nek.
Az újdonságok
A 4.6-os Opus alaposabban tervez, hosszabb ideig képes fenntartani az ügynöki feladatok taskjait, nagyobb kódbázisok esetében is megbízhatóbb. Javítottak a kódellenőrzési és hibakeresési képességein, amellyel saját hibáit szűri ki, és nem utolsósorban egymillió tokenes kontextusablakot kapott.
A továbbfejlesztett képességei miatt számos területen lehet használni, állítja a cég: például pénzügyi elemzések futtatására (az ezt mérő tesztekben jelenleg a legjobb), kutatásra, dokumentumok, táblázatok és prezentációk (leginkább Excel és PowerPoint) létrehozására és kezelésére. A modell a Coworkön belül képes önálló multitaskos munkavégzésre. Segítségével a Claude Code-ban ügynökcsapatokat lehet összerakni, hogy közösen dolgozzanak a feladaton.
A modell új verziója a korábbiaknál körültekintőbben választja ki a lehetséges válaszok közül a (szerinte) megfelelőt. Ez jobb eredményeket ad a nehezebb, összetettebb problémákra, de fölösleges költségeket generálhat az egyszerűbb feladatoknál. Ha a modell nem érzékelné a kontextusból a feladat komplexitását, a használója kézzel csökkentheti a megoldásba fektetett erőfeszítések mértékét.
És a szuperbiztonság... Az Anthropic több tesztet is felhozott annak bizonyítására, hogy sok területen most az Opus 4.6 a legjobb. Ugyanakkor ez nem ment a biztonság rovására – olvasható a közleményében. Például alacsony arányban mutatott hibás viselkedést (megtévesztés, a felhasználói téveszmék bátorítása, visszaélésekkel való együttműködés stb.). Egyik erőssége, hogy elég jól képes felismeri, ha rosszra akarják használni. De a vállalat szerint abban is jó, hogy megtalálja és javítsa nyílt forráskódú szoftverekben a sebezhetőségeket.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
HPE Morpheus VM Essentials: a virtualizáció arany középútja
Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?