De ott is olyan hatékony, hogy felveszi a versenyt a nagyobb modellekkel, mint például a Meta Llama 2-7B. Egyelőre csak kutatási célokra használható.

Nem kell hatalmas adatközpont, hogy egy MI-modell hatékony legyen, állítja a Microsoft. A szoftvervállalat kutatási részlege tegnap elérhetővé tette a Phi-2 nevű SLM-jét, azaz kis nyelvi modelljét (small language model). Az újdonság már elérhető az Azure AI Studio modellkatalógusában. Magának a modellnek a bejelentése egyébként már novemberben az Ignite konferencián megtörtént: Satya Nadella vezérigazgató beszélt róla röviden.

A 2,7 milliárd paramétert tartalmazó nyelvi modell felveszi a versenyt a 13 milliárdnál kevesebb paramétert tartalmazó alapnyelvi modellekkel, állítják a fejlesztők. A benchmarkok szerint teljesítménye megfelel vagy felülmúlja akár 25-ször nagyobb modellekét is. Kiemelkedő eredményei elsősorban a modell skálázhatóságának és a képzési adatok megfelelő összeállításának köszönhetők.

A Microsoft összeeresztette a Phi-2-t két 7 millió paramétert használó modellel, a Meta Llama-2-vel és a Mistral 7B-vel, valamint a Google közelmúltban bemutatott és három változatban elérhető Geminijének szintén edge-re (pl. a Pixel telefonokba) szánt változatával, a Gemini Nano 2-vel is, amely félmilliárddal több paramétert tartalmaz, mint a Microsoft kis nyelvi modellje. A mérések – pontosítsunk: a Microsoft mérései – szerint a Phi-2 mindegyiknél jobban teljesít, például kevesebb "toxicitást" és torzítást produkál a válaszaiban, mint a Llama 2, és annál sokkal hatékonyabban old meg például kódolási és a matematikai feladatokat.

Sőt, a Microsoft fejlesztői elvégeztették a Phi-2-vel azokat a fizikafeladatokat is, melyekkel a Google a Gemini Ultra képességeit demonstrálta (videó), és kiderült, hogy a Phi-2 is simán megoldja ugyanazokat a problémákat. (A Google egyébként sokat kritizált Gemini-demóvideóit itt lehet egyben megnézni.)

Egyelőre csak kísérletezésre

Kompakt méretű SLM felhasználását jelentősen korlátozza, hogy a Microsoft a használatát speciális licenccel egyelőre kizárólag kutatási célokra engedélyezi, kereskedelmi célokra, például termékfejlesztésre nem. Ezt egyébként Nadella már az Ignite-on is jelezte.

A modell használatában fontos szerepe van az Azure AI Studiónak is, többek között abban, hogy az MI-t ki lehessen tenni bármely végpontra. Nadella szerint ugyanis a fejlesztés következő lépcsőfoka az lesz, hogy a felhőben és a peremen futó MI-k erejét kombinálják. Ehhez azonban szükség van olyan hatékony, korlátozott erőforrásokkal is működő modellekre, mint a Phi-2.

(A nyitóképen: Satya Nadella a Phi-2-ről beszél az Ignite közönségének. Forrás: Microsoft.)

Cloud & big data

Megsemmisültek Kínában a külföldi mobilok

Egy helyi kutatócég szerint októberben majdnem feleannyi nem kínai kötődésű okostelefont adtak el a távol-keleti birodalomban, mint egy évvel korábban.
 
Ezt már akkor sokan állították, amikor a Watson vagy a DeepMind még legfeljebb érdekes játék volt, mert jó volt kvízben, sakkban vagy góban.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.