Nem kell hatalmas adatközpont, hogy egy MI-modell hatékony legyen, állítja a Microsoft. A szoftvervállalat kutatási részlege tegnap elérhetővé tette a Phi-2 nevű SLM-jét, azaz kis nyelvi modelljét (small language model). Az újdonság már elérhető az Azure AI Studio modellkatalógusában. Magának a modellnek a bejelentése egyébként már novemberben az Ignite konferencián megtörtént: Satya Nadella vezérigazgató beszélt róla röviden.
A 2,7 milliárd paramétert tartalmazó nyelvi modell felveszi a versenyt a 13 milliárdnál kevesebb paramétert tartalmazó alapnyelvi modellekkel, állítják a fejlesztők. A benchmarkok szerint teljesítménye megfelel vagy felülmúlja akár 25-ször nagyobb modellekét is. Kiemelkedő eredményei elsősorban a modell skálázhatóságának és a képzési adatok megfelelő összeállításának köszönhetők.
A Microsoft összeeresztette a Phi-2-t két 7 millió paramétert használó modellel, a Meta Llama-2-vel és a Mistral 7B-vel, valamint a Google közelmúltban bemutatott és három változatban elérhető Geminijének szintén edge-re (pl. a Pixel telefonokba) szánt változatával, a Gemini Nano 2-vel is, amely félmilliárddal több paramétert tartalmaz, mint a Microsoft kis nyelvi modellje. A mérések – pontosítsunk: a Microsoft mérései – szerint a Phi-2 mindegyiknél jobban teljesít, például kevesebb "toxicitást" és torzítást produkál a válaszaiban, mint a Llama 2, és annál sokkal hatékonyabban old meg például kódolási és a matematikai feladatokat.
Sőt, a Microsoft fejlesztői elvégeztették a Phi-2-vel azokat a fizikafeladatokat is, melyekkel a Google a Gemini Ultra képességeit demonstrálta (videó), és kiderült, hogy a Phi-2 is simán megoldja ugyanazokat a problémákat. (A Google egyébként sokat kritizált Gemini-demóvideóit itt lehet egyben megnézni.)
Egyelőre csak kísérletezésre
Kompakt méretű SLM felhasználását jelentősen korlátozza, hogy a Microsoft a használatát speciális licenccel egyelőre kizárólag kutatási célokra engedélyezi, kereskedelmi célokra, például termékfejlesztésre nem. Ezt egyébként Nadella már az Ignite-on is jelezte.
A modell használatában fontos szerepe van az Azure AI Studiónak is, többek között abban, hogy az MI-t ki lehessen tenni bármely végpontra. Nadella szerint ugyanis a fejlesztés következő lépcsőfoka az lesz, hogy a felhőben és a peremen futó MI-k erejét kombinálják. Ehhez azonban szükség van olyan hatékony, korlátozott erőforrásokkal is működő modellekre, mint a Phi-2.
(A nyitóképen: Satya Nadella a Phi-2-ről beszél az Ignite közönségének. Forrás: Microsoft.)
Digitalizáció a mindennapokban: hogyan lesz a stratégiai célból napi működés?
A digitális transzformáció sok vállalatnál már nem cél, hanem elvárás – mégis gyakran megreked a tervezőasztalon. A vezetői szinten megfogalmazott ambiciózus tervek nehezen fordulnak át napi működéssé, ha hiányzik a technológiai rugalmasság vagy a belső kohézió.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak