A Meta csütörtökön jelentette be Code Llama nevű nagy nyelvi modelljét (LLM), amely szöveges promptok alapján képes programkódok létrehozására és magyarázatára. Az ingyenesen elérhető szolgáltatás a szöveggenerátorok, nyelvi fordítók vagy hang létrehozására szolgáló MI-modellek megjelenését követően egy olyan gépi tanuló rendszerrel bővíti a Meta eszköztárát, amit már kifejezetten kódok írására hozták létre természetes nyelvi – különösen angol – bemenetek alapján. A Code Llama a társaság közlése szerint kódkiegészítésre és hibakeresésre is használható számos programozási nyelven (Python, C++, Java, PHP stb.).
Az új MI a nyílt forrású Llama 2 modellre épül, amit július közepén tettek nyilvánosan és ingyenesen elérhetővé. A Meta blogján megjelent bejegyzés szerint a vállalat úgy látja, hogy a mesterséges intelligencia, különösen pedig a kódoláshoz használt nagy nyelvi modellek sokat profitálnak a nyílt megközelítésből az innováció és a biztonság tekintetében is. A publikusan hozzáférhető, kódspecifikus modellek kiadása így nem csak az emberek életét javító új technológiák fejlesztéséban segít, de lehetővé teszi, hogy a teljes közösség értékelje azok képességeit, azonosítsa problémáikat és szükség szerint javítsa a sebezhetőségeiket is.
A Reuters beszámolója kiemeli, hogy a nyílt forrású Llama ennek megfelelően komoly kihívást jelent a tulajdonosi modelleket értékesítő cégek, így a Microsoft által támogatott OpenAI vagy az Alphabet-Google számára is. Az open source és a saját hardverek kombinációja ugyanis nyilvánvaló előnyöket kínál sok ügyfél számára az adatvédelemben vagy más területeken, pláne, hogy ezeket könnyebben igazíthatja mindenki a saját szabályaihoz, sőt a spóroláson vagy a hatékonyságnövelésen túl akár újabb szolgáltatásokat is építhet rá. A dolognak természetesen kockázatai is vannak, de azok a műfaj egészére jellemzők.
A Meta is óvatosságot javasol
Korábban már megállapították, hogy az MI-eszközökkel dolgozó mérnökök nagyobb valószínűséggel hagynak biztonsági réseket az alkalmazásaikban feltört programok meghívásával vagy nem biztonságos konfigurációk használatával. Ugyancsak problémás, amikor a kódgeneráló modelleket korlátozó licenccel rendelkező kódokon tanítják be, amelyek visszanyerhetők a rendszerből. Ott vannak aztán az olyan rosszindulatú felhasználások, mint a modellek finomhangolása a szivárogtatások és a kódban található sebezhetőségek azonosítására, netán kártékony programok készítése a megfelelően fogalmazott utasításokkal.
Azt a Meta is elismeri, hogy a Code Llama pontatlan vagy kifogásolható válaszokat generálhat egy-egy felkérésre, és az LLM-ek működésének sajátosságai miatt a potenciális teljesítményét sem lehet előre megjósolni. Ezért azt javasolják, hogy a Code Llama alkalmazásainak üzembe helyezése előtt végezzenek ahhoz igazított biztonsági tesztelést és hangolást. A kereskedelmi vagy kutatási célú telepítésekhez így is csak egy sima beleegyezést kérnek a jóhiszemű felhasználásról, külön licencre pedig a Meta szolgáltatásainak nagyságrendjében mozgó, havi 700 millió havi aktív felhasználóval rendelkező platformokon lesz szükség.
Mint kiderült, a modellek mérete 7-34 milliárd paraméterig terjed – az előbbi akár egyetlen GPU-n is futhat, az utóbbihoz pedig lényegesen erősebb hardver szükséges ugyan, de a legjobb teljesítményt ígéri az eddig nyílt forrású kódgenerátorok között. A Code Llama más tekintetben is többféle változatban lesz elérhető, jön például Python nyelvre optimalizált verziója, vagy olyan kiadása, amelyiket a természetes nyelven kiadott utasítások megértésére hegyeznek ki. Ez is a Llama 2 szöveggenerátoron alapul, ami egyébként maga is képes kódokat létrehozni, de nem feltétlenül olyan minőségben, mint a direkt erre épített modellek.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?