Egy New Yorkban tegnap tartott mesterséges intelligenciára fókuszáló rendezvényén jelentette be a Google az úgynevezett 1000 Languages Initiative-et. A kezdeményezés nevében hordozza célját, ami egy olyan MI-modell létrehozása, amely képes megérteni és feldolgozni a világ ezer leggyakrabban beszélt nyelvét.
Az erről, illetve általában a mesterséges intelligenciában rejlő lehetőségekről kiadott blogposztban a vállalat vezető munkatársa arról ír, hogy a nyelv a legfontosabb kommunikációs eszközünk, ám miközben világszerte több mint 7000 nyelvet beszélnek az emberek, ezek elenyésző része van "rendesenl reprezentálva" az interneten. Utóbbi alapvetően megnehezíti a gépi fordítást végző programok dolgát, hiszen ezeket az algoritmusokat hatalmas mennyiségű adattömegre támaszkodva fejlesztik, ami nem áll rendelkezésre a kisebb (de potenciálisan akár több millió embert is kitevő) népességek által használt nyelvek, nyelvjárások esetében.
A helyzet orvoslására a keresőóriás kutatói kifejlesztettek egy univerzális beszédmodellt (Universal Speech Model, USM), amelyet több mint 400 nyelvre képeztek ki, így ez a cég állítása szerint az eddigi legnagyobb lefedettségű beszédmodellnek tekinthető. A készlet kibővítésére a Google folyamatosan keresi az együttműködési lehetőségeket a világ különböző közösségeivel, hogy hozzájuthasson a szükséges adatkészletéhez a még nem lefedett nyelvek esetében is.
A cég témával kapcsolatos erőfeszítéseit a legtöbben a Google Translate/Fordító szolgáltatáson keresztül tapasztalhatták meg a gyakorlatban. A vállalat hosszú évek óta csiszolja nyelvi feldolgozási technológiáját, hogy aztán azt a fülhallgatóktól kezdve a YouTube automatikusan generált feliratozásáig portfóliója számos eleménél kamatoztathassa.
Mások sem tétlenkednek
A Google-lel több fronton is riválisként küzdő Meta épp a nyáron jelentette be szándékát, miszerint egyetlen nyelvet sem hagy az út szélén. A Facebok anyavállalatának új fordítóprogramja a cég állítása szerint minden tekintetben lepipálja a hasonló alkalmazásokat. A mesterséges intelligenciára támaszkodó algoritmus legfontosabb tulajdonsága, hogy összesen 200 különböző nyelvvel képes megbirkózni bármilyen kombinációpárban. Köztük van több tucat olyan afrikai nyelv is, amelyet a jelenleg széles körben használt fordítóeszközök egyike sem támogat.
Ráadásul a témával kapcsolatos kutatások újabb eredményeket hoztak ősszel. A Meta munkatársainak sikerült MI-alapú beszéd-beszéd fordítórendszert készíteni a hokkienhez. Ez egy elsősorban szóbeli kínai nyelvjárás, amit a szakemberek kvázi esettanulmányként használnának az univerzális beszédfordító megalkotásához.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak