Tegnapi blogbejegyzésében új korszak nyitányaként aposztrofálja a Meta azt, hogy elérhetővé tette nyílt forráskódú nagy nyelvi modelljének (large language modell, LLM) legújabb és minden korábbinál "testesebb" verzióját. A többek között a Facebookot és az Instagramot birtokló közösségi óriás mérései alapján a Llama 3.1 405B abszolút megállja a helyét a konkurencia legfejlettebb, legnagyobb modelljeivel (a GPT-4, a GPT-4o és a Claude 3.5 Sonnet) szemben is.
A világ "legnagyobb és legképzettebb nyíltan elérhető alapmodellje" a cég szerint új alkalmazások és modellezési paradigmák megjelenéséhez vezet majd, "beleértve a szintetikus adatok generálását, amely lehetővé teszi a kisebb modellek javítását és képzését, valamint a modell-desztillációt".
A 405 milliárd paraméterrel büszkélkedő új zászlóshajó megjelenése mellett jelentős ráncfelvarrást kapott a két kisebb változat, amelyek idén tavasszal debütáltak. A kompakt 8B és a közepes 70B modellekkel így már az angol mellett további hét nyelven is fel lehet venni a kapcsolatot, miközben az algoritmusok rövid távú memóriájaként emlegetett kontextusablak szintén lényegesen nagyobb lett (8-ról 128 ezer tokenre nőtt).
A Meta mindeközben tovább lazított a licencfeltételein, ami lehetővé teszi a fejlesztők számára, hogy a Llama modellek kimeneteit – beleértve a 405B-t is – más modellek javítására, trenírozására használják.
Szabadon szárnyalnának
A vállalat vezérigazgatója a bejelentéssel párhuzamosan egy saját írást is publikált, amelyben a mesterséges intelligencia nyílt fejlesztésének fontosságát hangsúlyozta. Mark Zuckerberg ennek kapcsán felemlegette a nyílt forráskódú Linux kernel és a szabadalmaztatott Unix operációs rendszerek harcát, amelyből előbbi került ki győztesen.
"A Linux egyre népszerűbb lett – kezdetben azért, mert lehetővé tette a fejlesztők számára, hogy úgy módosítsák a kódját, ahogyan csak akarják, és mert megfizethetőbb volt, idővel pedig azért, mert fejlettebbé, biztonságosabbá vált, és szélesebb ökoszisztémája több képességet támogatott, mint bármelyik zárt Unix" – írta. "Úgy vélem, hogy a mesterséges intelligencia is hasonló módon fog fejlődni."
A papíron jól hangzó kezdeményezés egyik aktuális problémája azonban a földrajzi és nyelvi lefedettség, pontosabban azok hiánya. A Llama képességeit desktopos környezetben bemutató meta.ai oldal például első körben csak az USA-ban volt elérhető, a nyelvi repertoár pedig a fentebb említett bővítés ellenére sem mondható lehengerlőnek. Az sem segít a koncepció elterjesztésében, hogy a Meta pár napja erősítette meg: szabályozási aggályok miatt egyelőre nem jelenteti meg összetettebb modelljeit az EU-ban (hasonló döntésre jutott nem sokkal korábban az Apple is).
Ölre mennek
A Llama erősödése és nyílt terjesztése arra viszont kiválóan alkalmas lehet, hogy Zuckerbergék nyomást gyakoroljanak az iparág többi szereplőjére. A közösségi hálózatokból befolyó bevételeire támaszkodva a Meta sokkal könnyebben égetheti a pénzt, mint mondjuk az MI-szolgáltatásai eladására támaszkodó OpenAI vagy Anthropic.
Talán az sem véletlen, hogy az OpenAI órákkal a Meta bejelentését követően kezdett ingyenes promócióba, amelynek keretében az alkalmazásfejlesztők egy meghatározott limit eléréséig költségmentesen tudják igényeikhez finomítani a cég múlt héten debütált GPT-4o mini modelljét.
(Illusztráció: Meta)
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak