Az Anthropic MI-modellje minden versenytársat kenterbe ver

Bitport2024.03.05.Cloud & big data

A Claude 3 emberi képességeket megközelítő teljesítményre képes bizonyos szituációkban, és lenyomja a GPT-4-et is - állítják a fejlesztői.

Erős állításokkal igyekszik magára irányítani a figyelmet az Anthropic. Az egykori OpenAI-alkalmazottak által mindössze 2021-ben alapított startup különböző mérési eredményekből jutott arra, hogy most bemutatkozó, legújabb generációt képviselő generatív algoritmusuk a legkomolyabb versenytársakkal összehasonlítva sem marad szégyenben, sőt...

A Claude 3 képességeit bemutató bejegyzés legnagyobb részét a témában használt különböző benchmarkok összehasonlítása teszi ki. Az Anthropic három különböző kiszerelésű MI-jét az OpenAI GPT-4 és GPT 3.5 modelljével, illetve a Google által nemrég kereskedelmi forgalomba hozott Gemini két változatával állították párhuzamba.

Generatív MI-modellek összehasonlítása (Forrás: Anthropic)

Ahogy a számokból kitűnik, a legösszetettebb feladatokra szánt Claude 3-változat, az Opus minden területen a legjobb eredményeket szállította. Ez még akkor is igaz, ha bizonyos feladatoknál mindössze tizedszázalékokkal tudott a GPT-4 előtt végezni, de például érvelésben közel 15 százalékot vert az OpenAI jelenleg elérhető legerősebb nagy nyelvi modelljére, és kódolásban is jóval előrébb tart. (A lábjegyzetben ugyanakkor az is szerepel, hogy a speciális GPT-4T változatból a táblázatban szereplőknél jobb eredményt is sikerült már kicsiholniuk a mérnököknek.)

A három tagból álló Claude 3 közül a Sonnet szolgálja ki a regisztrációt követően ingyenesen elérhető Claude.ai chatbotot. "A munkaterhelések túlnyomó többségénél a Sonnet 2x gyorsabb, mint a Claude 2 és a Claude 2.1 magasabb intelligenciaszintekkel. Kiválóan teljesít a gyors válaszokat igénylő feladatokban, mint például a keresés vagy az értékesítés automatizálása" - olvasható az Anthropic közleményében.

Az Opus az előző generációs rendszerekhez hasonló sebességgel dolgozikű, ám "sokkal magasabb intelligenciaszintekkel". További előnye, hogy multimodális, azaz már szöveges és képi bementekkel egyaránt megbirkózik. A cég legnagyobb és legerősebb LLM-je havi 20 dollárért állítható munkába a Claude Pro csomagon keresztül.

A család legkisebbje a Haiku, amely kompaktságának köszönhetően egyszerre tud gyorsan és olcsón dolgozni. Ez azonban a fejlesztők szerint nem megy a minőség rovására, mivel így is képes néhány másodperc alatt alaposan átvizsgálni egy diagramokkal és grafikonokkal megtűzdelt kutatási tanulmányt.

Üstökösként hasítanak

Bár az Anthropic neve nem ismert olyan széles körben, mint az OpenAI, az idén harmadik születésnapját ünneplő startup így is óriási lépésekkel halad, amit az MI-fejlesztések iránt érdeklődő nagyok is észrevettek. Csak tavaly, közel 7 milliárd dollárnyi tőkét fektettek a cég hosszú távú működtetésébe olyan vállalatok, mint például az Amazon és a Google.

Az Anthropicnak van egy fontos előnye az OpenAI-val szemben (ahonnan az Anthropic-alapítók is érkeztek): már nem kellett megfutniuk a "populáris" köröket, hogy a témát bevigyék a köztudatba. Így tudtak a vállalati megoldásokra koncentrálni, ami viszont olyan befektetők számára is vonzó, mint a Zoom és a Salesforce, melyek szintén beszálltak a startup finanszírozásába. Az ilyen fejlesztések kevesebb ember számára érdekesek, de az Anthropic menedzsmentje szerint hosszú távú üzleti modellt csak professzionális MI-szolgáltatásokra lehet építeni.

Az Anthropic fejlesztéseinek eddig kifejezetten jó volt a szakmai visszhangja. Egy független tesztplatform például tavaly a Claude 2-t hozta ki a legmegbízhatóbb chatbotnak, amely pontosan felméri "képességei" határait, és csak olyan kérdésekre válaszol, amelyekre a képzése kiterjed.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hatósági jelentés lökheti még mélyebbre a rossz szériában lévő Teslát

Elon Musk szerint aki nem bízik a cég önvezető technológiájában, az inkább ne is fektesse bele a pénzét. Egyelőre úgy fest, hogy sokan megfogadják a tanácsát.

Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A hónap témája

Mennyibe kerül az adat mentése és helyreállítása?

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Podcast

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

CIO Podcast #58: Valóban mindenre (is) jó az MI?

MÉG TÖBB CIO PODCAST »

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hatósági jelentés lökheti még mélyebbre a rossz szériában lévő Teslát

Mennyibe kerül az adat mentése és helyreállítása?

Régen minden jobb volt? A VMware licencelési változásai

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2024 konferencia