Nem kell hatalmas adatközpont, hogy egy MI-modell hatékony legyen, állítja a Microsoft. A szoftvervállalat kutatási részlege tegnap elérhetővé tette a Phi-2 nevű SLM-jét, azaz kis nyelvi modelljét (small language model). Az újdonság már elérhető az Azure AI Studio modellkatalógusában. Magának a modellnek a bejelentése egyébként már novemberben az Ignite konferencián megtörtént: Satya Nadella vezérigazgató beszélt róla röviden.
A 2,7 milliárd paramétert tartalmazó nyelvi modell felveszi a versenyt a 13 milliárdnál kevesebb paramétert tartalmazó alapnyelvi modellekkel, állítják a fejlesztők. A benchmarkok szerint teljesítménye megfelel vagy felülmúlja akár 25-ször nagyobb modellekét is. Kiemelkedő eredményei elsősorban a modell skálázhatóságának és a képzési adatok megfelelő összeállításának köszönhetők.
A Microsoft összeeresztette a Phi-2-t két 7 millió paramétert használó modellel, a Meta Llama-2-vel és a Mistral 7B-vel, valamint a Google közelmúltban bemutatott és három változatban elérhető Geminijének szintén edge-re (pl. a Pixel telefonokba) szánt változatával, a Gemini Nano 2-vel is, amely félmilliárddal több paramétert tartalmaz, mint a Microsoft kis nyelvi modellje. A mérések – pontosítsunk: a Microsoft mérései – szerint a Phi-2 mindegyiknél jobban teljesít, például kevesebb "toxicitást" és torzítást produkál a válaszaiban, mint a Llama 2, és annál sokkal hatékonyabban old meg például kódolási és a matematikai feladatokat.
Sőt, a Microsoft fejlesztői elvégeztették a Phi-2-vel azokat a fizikafeladatokat is, melyekkel a Google a Gemini Ultra képességeit demonstrálta (videó), és kiderült, hogy a Phi-2 is simán megoldja ugyanazokat a problémákat. (A Google egyébként sokat kritizált Gemini-demóvideóit itt lehet egyben megnézni.)
Egyelőre csak kísérletezésre
Kompakt méretű SLM felhasználását jelentősen korlátozza, hogy a Microsoft a használatát speciális licenccel egyelőre kizárólag kutatási célokra engedélyezi, kereskedelmi célokra, például termékfejlesztésre nem. Ezt egyébként Nadella már az Ignite-on is jelezte.
A modell használatában fontos szerepe van az Azure AI Studiónak is, többek között abban, hogy az MI-t ki lehessen tenni bármely végpontra. Nadella szerint ugyanis a fejlesztés következő lépcsőfoka az lesz, hogy a felhőben és a peremen futó MI-k erejét kombinálják. Ehhez azonban szükség van olyan hatékony, korlátozott erőforrásokkal is működő modellekre, mint a Phi-2.
(A nyitóképen: Satya Nadella a Phi-2-ről beszél az Ignite közönségének. Forrás: Microsoft.)
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak