Jelentősen erősödik a Google gépi fordítást végző szolgáltatása, a Translate. A keresőóriás mai blogbejegyzése szerint újabb 110 nyelven lesz képes legalább alapszintű tolmácsolásra az algoritmus. Talán mondani sem kell, hogy az emberiség nagyjából 8 százalékát érintő bővítésben elengedhetetlen érdemei vannak korunk csodaszerének, a mesterséges intelligenciának.
A Google saját fejlesztésú PaLM 2 nyelvi modellje kellett ugyanis ahhoz, hogy a Translate "hatékonyabban tanulja meg az egymással szoros kapcsolatban álló nyelveket" – mondta Isaac Caswell, a techóriás szoftvermérnöke a közleményben. Ilyen szoros kapcsolatban álló nyelvek például a hindihez közeli awadhi és marwadi, vagy éppen az olyan francia kreol nyelvek, mint a seychelle-i kreol és a mauritiusi kreol.
A szolgáltatás mögött álló MI egy másik "trükkje" a nyelvek regionális változatainak, dialektusainak feldolgozásánál érhető tetten. Ilyenkor az algoritmus egyfajta mixet készít a különböző változatokból, ahol az elemek arányát "az egyes nyelvek leggyakrabban használt változatai" alapján határozzák meg.
Erre a blogbejegyzés példaként a romani, azaz cigány nyelvet hozza, amelynek Európa-szerte számos dialektusa van. A vállalat modelljei által előálított szöveg leginkább egy általánosan használt online nyelvjárásra hasonlítanak, de keverednek benne elemek más változatokból is.
Az új nyelveket a Google szerint több mint 614 millió ember beszéli. A most bekerült nyelvek között van olyan, amelyet több mint 100 millióan használnak, és olyanok is, amelyeket csak őslakosok kis közösségei beszélnek. Sőt néhánynak szinte nincs is anyanyelvi beszélője, de "aktív erőfeszítéseket tesznek az újjáélesztésükre". A bővítésnek Afrikában különösen örülhetnek, hiszen a bekerült nyelvek mintegy negyede onnan származik.
Régi bútordarab
A Translate a kereső után talán az egyik legismertebb Google-szolgáltatás, amely már 2016-ban is több mint 100 nyelven igyekezett segíteni egymás megértésében. A funkció és a képességek fejlesztése azóta is folyamatos, és mára eljutottunk oda, hogy műfordításra ugyan nem alkalmazható, de az eredeti értelmet nagyjából megtartó, koherens szövegeket már stabilan képes produkálni az algoritmus.
A keresőóriás a mostani bejelentéssel egyébként egy nagy lépéssel közelebb került ahhoz a korábban deklarált céljához, miszerint tolmácsolásra alkalmas modelljeikkel szeretnék lefedni az emberiség által leginkább használt 1000 nyelvet. (A beszélt nyelvek számát nagyjából 7000-re teszik a szakértők, a különféle dialektusok nagyságrendje pedig megközelíti a 20 ezret.)
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak