A japánok evolúcióval fejlődő MI modellt építettek

Bitport2024.03.21.Cloud & big data

Egy tokiói startup azt állítja, hatékony módszert talált arra, hogy az MI utód modelleket hozzon létre, és kiválassza közülük a leghatékonyabbat.

A Sakana AI nevű japán mesterséges intelligencia startup szerint olyan módszert dolgozott ki, amelynek segítségével az MI önmagát tudja javított formában reprodukálni. Azaz a generatív MI létrehoz akárhány gyermek modellt, majd kiválasztja közülük a leghatékonyabbakat, azaz képes lesz az evolúció és a természetes szelekció szabályai szerint működni. Ezzel a módszerrel elvileg lényegesen olcsóbb és gyorsabb lesz az MI-fejlesztés.

A startup egyelőre három generatív MI-t készített: egy LLM-et (large language model), valamint egy image-to-text és egy képgeneráló modellt. A kiindulási pont (azaz a szülők) három nyílt forráskódú modell volt, és azokat szaporították ("tenyésztették"). Így született több mint 100 utód. A Sakanai AI algoritmusa azok közül kiválasztotta a legjobban teljesítőket, majd azok kezdtek el szaporodni és így tovább. A folyamat több száz generáción keresztül ismétlődött, míg végül megszületett a három végeredmény.

Eddig is voltak eljárások két modell egyesítésére, ám azok mindegyike rengeteg manuális munkával, fejlesztéssel járt. A japán startup "evolúciós" algoritmusa viszont automatikusan kiválasztja a legjobb modelleket, és az egyesítést is elvégzi a megadott céloknak megfelelően.

A költségmegtakarítás jelentős: a három modell létrehozása, azaz a teljes evolúciós folyamat végigvitele egy nap alatt megvolt, és a költség pedig jelképes volt – főleg egy hasonló képességű modelléhez képest. A cég a beszámolók szerint nem részletezte, hogy mennyibe került a kísérlet, de azt más példákból tudni, hogy egy hasonló méretű LLM kidolgozása hónapokat és dollármilliókat emésztene fel. A Sakana AI azt állítja, hogy LLM-je, melyet japán nyelvű matematikai feladatok megoldására optimalizáltak, ennél a célfeladatnál jobban teljesít, mint az OpenAI GPT-3.5. (Ez amúgy nem különösebben meglepő: mint a magyar nyelvre optimalizált Puli-GPT kapcsán is írtuk, a Chat GPT alapvetően angol nyelvű modell, képzéséhez kb. 180 milliárd szavas angol szövegállományt használtak, míg a többi nyelvhez egy-két nagyságrenddel kisebbet, magyarul például 120-130 millió állományon tanult.)

Olcsó, gyors és kooperatív modellek

A Sakana AI a generatív MI-vel kapcsolatos fejlesztések fő sodrától eltérően olyan speciális modelleket akar fejleszteni, melyek kollaborálnak egymással, és így oldanak meg összetett problémákat. A startup úgy véli, megközelítése megoldást ad arra a problémára is, hogy jelenleg magas a belépési küszöb az MI-fejlesztésbe. Ha egy vállalkozás be szeretne szállni az ágazatba, hiába van elméletileg is jól megalapozott koncepciója, a modellépítéshez drága hardverekre, jelentős számítási kapacitásra van szüksége, melyek dollár százmilliókba is kerülhetnek.

A tavaly alapított Sakana AI erre kereste és találta meg a megoldást a természetben, pontosabban az evolúcióban. A cég alapítói közül ketten, David Ha és Llion Jones korábban a Google-nél dolgoztak, és ötletükhöz megnyerték Ren Itót, aki korábban többek között a Stability AI operatív vezetője volt, de dolgozott kockázati befektetőként is. A cég az első jelentős befektetését idén januárban kapta: 30 millió dollárt.

A modellfejlesztést automatizáló megoldásról a Sakana AI oldalán található részletes leírás. »

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

MI-alapú alibizés terjed az irodákban

A workslopként emlegetett jelenség hátulütőiről már konkrét számokkal is szolgál egy nemrégiben készített amerikai kutatás.

A hónap témája

Az MI nevű fejlesztő a CNAPP-koncepciót is módosította

A mesterséges intelligencia nemcsak az alkalmazásfejlesztést gyorsítja. Hasonló hatékonysággal támogatja a kiberbűnözőket is.

a melléklet támogatója a Clico Hungary

CIO Podcast

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

CIO Podcast #63: A stressz, a felső vezetők és két perc néma csend

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

MI-alapú alibizés terjed az irodákban

Az MI nevű fejlesztő a CNAPP-koncepciót is módosította

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia