Ezer nyelven tolmácsolna a Google

Bitport2022.11.03.Cloud & big data

A keresőóriás megsokszorozná a világon beszélt nyelvek feldolgozásával kapcsolatos, jelenleg sem szerény képességeit.

Egy New Yorkban tegnap tartott mesterséges intelligenciára fókuszáló rendezvényén jelentette be a Google az úgynevezett 1000 Languages Initiative-et. A kezdeményezés nevében hordozza célját, ami egy olyan MI-modell létrehozása, amely képes megérteni és feldolgozni a világ ezer leggyakrabban beszélt nyelvét.

Az erről, illetve általában a mesterséges intelligenciában rejlő lehetőségekről kiadott blogposztban a vállalat vezető munkatársa arról ír, hogy a nyelv a legfontosabb kommunikációs eszközünk, ám miközben világszerte több mint 7000 nyelvet beszélnek az emberek, ezek elenyésző része van "rendesenl reprezentálva" az interneten. Utóbbi alapvetően megnehezíti a gépi fordítást végző programok dolgát, hiszen ezeket az algoritmusokat hatalmas mennyiségű adattömegre támaszkodva fejlesztik, ami nem áll rendelkezésre a kisebb (de potenciálisan akár több millió embert is kitevő) népességek által használt nyelvek, nyelvjárások esetében.

A helyzet orvoslására a keresőóriás kutatói kifejlesztettek egy univerzális beszédmodellt (Universal Speech Model, USM), amelyet több mint 400 nyelvre képeztek ki, így ez a cég állítása szerint az eddigi legnagyobb lefedettségű beszédmodellnek tekinthető. A készlet kibővítésére a Google folyamatosan keresi az együttműködési lehetőségeket a világ különböző közösségeivel, hogy hozzájuthasson a szükséges adatkészletéhez a még nem lefedett nyelvek esetében is.

A cég témával kapcsolatos erőfeszítéseit a legtöbben a Google Translate/Fordító szolgáltatáson keresztül tapasztalhatták meg a gyakorlatban. A vállalat hosszú évek óta csiszolja nyelvi feldolgozási technológiáját, hogy aztán azt a fülhallgatóktól kezdve a YouTube automatikusan generált feliratozásáig portfóliója számos eleménél kamatoztathassa.

Mások sem tétlenkednek

A Google-lel több fronton is riválisként küzdő Meta épp a nyáron jelentette be szándékát, miszerint egyetlen nyelvet sem hagy az út szélén. A Facebok anyavállalatának új fordítóprogramja a cég állítása szerint minden tekintetben lepipálja a hasonló alkalmazásokat. A mesterséges intelligenciára támaszkodó algoritmus legfontosabb tulajdonsága, hogy összesen 200 különböző nyelvvel képes megbirkózni bármilyen kombinációpárban. Köztük van több tucat olyan afrikai nyelv is, amelyet a jelenleg széles körben használt fordítóeszközök egyike sem támogat.

Ráadásul a témával kapcsolatos kutatások újabb eredményeket hoztak ősszel. A Meta munkatársainak sikerült MI-alapú beszéd-beszéd fordítórendszert készíteni a hokkienhez. Ez egy elsősorban szóbeli kínai nyelvjárás, amit a szakemberek kvázi esettanulmányként használnának az univerzális beszédfordító megalkotásához.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Ezekkel az EU-s oktatóanyagokkal a cégvezetők is pengék lehetnek MI-ben

Az angol nyelvű tananyagokat az ARISA projekt keretében fejlesztették. Kezdőknek, haladóknak és a csak az MI dallamára kíváncsi vezetőknek is vannak kurzusok.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ezekkel az EU-s oktatóanyagokkal a cégvezetők is pengék lehetnek MI-ben

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!