A Meta csütörtökön jelentette be Code Llama nevű nagy nyelvi modelljét (LLM), amely szöveges promptok alapján képes programkódok létrehozására és magyarázatára. Az ingyenesen elérhető szolgáltatás a szöveggenerátorok, nyelvi fordítók vagy hang létrehozására szolgáló MI-modellek megjelenését követően egy olyan gépi tanuló rendszerrel bővíti a Meta eszköztárát, amit már kifejezetten kódok írására hozták létre természetes nyelvi – különösen angol – bemenetek alapján. A Code Llama a társaság közlése szerint kódkiegészítésre és hibakeresésre is használható számos programozási nyelven (Python, C++, Java, PHP stb.).
Az új MI a nyílt forrású Llama 2 modellre épül, amit július közepén tettek nyilvánosan és ingyenesen elérhetővé. A Meta blogján megjelent bejegyzés szerint a vállalat úgy látja, hogy a mesterséges intelligencia, különösen pedig a kódoláshoz használt nagy nyelvi modellek sokat profitálnak a nyílt megközelítésből az innováció és a biztonság tekintetében is. A publikusan hozzáférhető, kódspecifikus modellek kiadása így nem csak az emberek életét javító új technológiák fejlesztéséban segít, de lehetővé teszi, hogy a teljes közösség értékelje azok képességeit, azonosítsa problémáikat és szükség szerint javítsa a sebezhetőségeiket is.
A Reuters beszámolója kiemeli, hogy a nyílt forrású Llama ennek megfelelően komoly kihívást jelent a tulajdonosi modelleket értékesítő cégek, így a Microsoft által támogatott OpenAI vagy az Alphabet-Google számára is. Az open source és a saját hardverek kombinációja ugyanis nyilvánvaló előnyöket kínál sok ügyfél számára az adatvédelemben vagy más területeken, pláne, hogy ezeket könnyebben igazíthatja mindenki a saját szabályaihoz, sőt a spóroláson vagy a hatékonyságnövelésen túl akár újabb szolgáltatásokat is építhet rá. A dolognak természetesen kockázatai is vannak, de azok a műfaj egészére jellemzők.
A Meta is óvatosságot javasol
Korábban már megállapították, hogy az MI-eszközökkel dolgozó mérnökök nagyobb valószínűséggel hagynak biztonsági réseket az alkalmazásaikban feltört programok meghívásával vagy nem biztonságos konfigurációk használatával. Ugyancsak problémás, amikor a kódgeneráló modelleket korlátozó licenccel rendelkező kódokon tanítják be, amelyek visszanyerhetők a rendszerből. Ott vannak aztán az olyan rosszindulatú felhasználások, mint a modellek finomhangolása a szivárogtatások és a kódban található sebezhetőségek azonosítására, netán kártékony programok készítése a megfelelően fogalmazott utasításokkal.
Azt a Meta is elismeri, hogy a Code Llama pontatlan vagy kifogásolható válaszokat generálhat egy-egy felkérésre, és az LLM-ek működésének sajátosságai miatt a potenciális teljesítményét sem lehet előre megjósolni. Ezért azt javasolják, hogy a Code Llama alkalmazásainak üzembe helyezése előtt végezzenek ahhoz igazított biztonsági tesztelést és hangolást. A kereskedelmi vagy kutatási célú telepítésekhez így is csak egy sima beleegyezést kérnek a jóhiszemű felhasználásról, külön licencre pedig a Meta szolgáltatásainak nagyságrendjében mozgó, havi 700 millió havi aktív felhasználóval rendelkező platformokon lesz szükség.
Mint kiderült, a modellek mérete 7-34 milliárd paraméterig terjed – az előbbi akár egyetlen GPU-n is futhat, az utóbbihoz pedig lényegesen erősebb hardver szükséges ugyan, de a legjobb teljesítményt ígéri az eddig nyílt forrású kódgenerátorok között. A Code Llama más tekintetben is többféle változatban lesz elérhető, jön például Python nyelvre optimalizált verziója, vagy olyan kiadása, amelyiket a természetes nyelven kiadott utasítások megértésére hegyeznek ki. Ez is a Llama 2 szöveggenerátoron alapul, ami egyébként maga is képes kódokat létrehozni, de nem feltétlenül olyan minőségben, mint a direkt erre épített modellek.
Digitalizáció a mindennapokban: hogyan lesz a stratégiai célból napi működés?
A digitális transzformáció sok vállalatnál már nem cél, hanem elvárás – mégis gyakran megreked a tervezőasztalon. A vezetői szinten megfogalmazott ambiciózus tervek nehezen fordulnak át napi működéssé, ha hiányzik a technológiai rugalmasság vagy a belső kohézió.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak