Jelentősen erősödik a Google gépi fordítást végző szolgáltatása, a Translate. A keresőóriás mai blogbejegyzése szerint újabb 110 nyelven lesz képes legalább alapszintű tolmácsolásra az algoritmus. Talán mondani sem kell, hogy az emberiség nagyjából 8 százalékát érintő bővítésben elengedhetetlen érdemei vannak korunk csodaszerének, a mesterséges intelligenciának.
A Google saját fejlesztésú PaLM 2 nyelvi modellje kellett ugyanis ahhoz, hogy a Translate "hatékonyabban tanulja meg az egymással szoros kapcsolatban álló nyelveket" – mondta Isaac Caswell, a techóriás szoftvermérnöke a közleményben. Ilyen szoros kapcsolatban álló nyelvek például a hindihez közeli awadhi és marwadi, vagy éppen az olyan francia kreol nyelvek, mint a seychelle-i kreol és a mauritiusi kreol.
A szolgáltatás mögött álló MI egy másik "trükkje" a nyelvek regionális változatainak, dialektusainak feldolgozásánál érhető tetten. Ilyenkor az algoritmus egyfajta mixet készít a különböző változatokból, ahol az elemek arányát "az egyes nyelvek leggyakrabban használt változatai" alapján határozzák meg.
Erre a blogbejegyzés példaként a romani, azaz cigány nyelvet hozza, amelynek Európa-szerte számos dialektusa van. A vállalat modelljei által előálított szöveg leginkább egy általánosan használt online nyelvjárásra hasonlítanak, de keverednek benne elemek más változatokból is.
Az új nyelveket a Google szerint több mint 614 millió ember beszéli. A most bekerült nyelvek között van olyan, amelyet több mint 100 millióan használnak, és olyanok is, amelyeket csak őslakosok kis közösségei beszélnek. Sőt néhánynak szinte nincs is anyanyelvi beszélője, de "aktív erőfeszítéseket tesznek az újjáélesztésükre". A bővítésnek Afrikában különösen örülhetnek, hiszen a bekerült nyelvek mintegy negyede onnan származik.
Régi bútordarab
A Translate a kereső után talán az egyik legismertebb Google-szolgáltatás, amely már 2016-ban is több mint 100 nyelven igyekezett segíteni egymás megértésében. A funkció és a képességek fejlesztése azóta is folyamatos, és mára eljutottunk oda, hogy műfordításra ugyan nem alkalmazható, de az eredeti értelmet nagyjából megtartó, koherens szövegeket már stabilan képes produkálni az algoritmus.
A keresőóriás a mostani bejelentéssel egyébként egy nagy lépéssel közelebb került ahhoz a korábban deklarált céljához, miszerint tolmácsolásra alkalmas modelljeikkel szeretnék lefedni az emberiség által leginkább használt 1000 nyelvet. (A beszélt nyelvek számát nagyjából 7000-re teszik a szakértők, a különféle dialektusok nagyságrendje pedig megközelíti a 20 ezret.)
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT A PROJEKTMENEDZSMENTRŐL TUDNI KELL!
Ütős esettanulmányok AI-ról, agilitásról, hibrid működésről, elosztott csapatokról, kulturális gapek kezeléséről. Exkluzív információk képzésekről, munkaerőpiacról, kereseti és karrierlehetőségekről.
2025.03.18. Symbol Budapest
Szakmai nap a jövőálló digitális infrastruktúra jegyében
A digitális infrastruktúra új kihívásai - legyen szó MI megoldásokról, szigorodó fenntarthatósági követelményekről, vagy az reziliens és szünetmentes működésről - szinte minden nagyobb szervezet életében meghatározó szerepet játszanak. Egy szakmai rendezvénysorozat segítségével közelebb kerülhetünk a megoldásokhoz és segítséget kaphatunk az új technológiák sikeres implementálásához.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak