
Hadászati és polgári célokra is bevethető független mesterségesintelligencia-rendszer fejlesztésébe kezd Ukrajna – jelentette be tegnap az ország digitális ügyekért felelős minisztériuma a Kyivstar telekommunikációs vállalattal közösen.
A Reuters beszámolója szerint a cél egy teljesen saját kézben tartott nagy nyelvi modell megalkotása, amely a mobilszolgáltató közleményét idézve "alapját képezi majd az ukrán köz- és magánszektorban működő új generációs mesterséges intelligencia alapú szolgáltatásoknak".
A projekt kezdeti szakaszában ugyanakkor komoly támaszt jelent a Google, amely egyrészt a fejlesztéshez szükséges infrastruktúrát, másrészt a nyílt súlyozású (open-weight), azaz szabadon paraméterezhető Gemma LLM-családot biztosítja. A távlati terv viszont az, hogy amint lehetséges, az ukrán változat átköltözik hazai infrastruktúrára, így az üzemeltetés és a további fejlesztés is "házon belül" marad.
Olekszandr Bornyakov digitalizációs átallásért felelős miniszterhelyettes azt már egy szeptemberi nyilatkozatában hangsúlyozta, hogy nem akarnak "sok millió dollárt fizetni" külföldi cégeknek. A spórolás mellett a saját rendszer másik előnye, hogy az így sokkal bátrabban használható fel az ukrán hadsereg támogatására. A miniszterhelyettes világossá is tette, hogy szándékosan nem akarnak az OpenAI modelljeire, vagy éppen olyan kínai LLM-ekre támaszkodni, mint például a DeepSeek vagy a Qwen.
Különleges nyelvjárások
A Google modelljéte egyrészt annak önálló fejleszthetősége, másrészt több nyelven nyújtott teljesítménye miatt esett a választás. Hírügynökségi források szerint a potenciális jelöltek között voltak még ugyanakkor a Meta által fejlesztett Llama és a francia Mistral AI modellek is.
A különböző nyelveken történő stabil eligazodás már csak azért is fontos, mert például Bornyakov szülővárosában, az Odessza megyében található Bolhradban az ukrán, orosz és bolgár nyelv keverékét használják – egy olyan dialektust, amelyet a meglévő MI-modellek nehezen kezelnek.
A félrefordítások és az LLM-ekre jellemző hallucinációk előfordulásának gyakoriságát igyekeznek minimalizálni. Ebben fontos szerep juthat annak a trenirozásra szánt adattömegnek, amelyhez az alapanyagot több mint 90 kormányzati intézménytől gyűjtik be, például bírósági nyilvántartásoktól, kiadóktól, regionális archívumoktól és a folyamatban lévő háború alatt Oroszország által végrehajtott cselekményeket dokumentáló nyilvántartásoktól érkeznek a források.
A kész rendszert először a kormányzati szolgáltatások és a Kyivstar platformjainak támogatására fgoják bevetni, ami a tervek szerint a későbbiekben kiterjesztenek a magánszektorra is. Ukrajna természetesen igyekszik biztonsági szempontból a lehető legrobosztusabbra tervezni a megoldást, mivel az borítékolhatóan kiemelt célpontja lesz az ország ellen 2022 februárja óta nyílt háborút folytató Moszkvának.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak