Miközben egyre égetőbb a kérdés, hogy kipukkad-e az MI-lufi, a Google-nél igyekeznek megmutatni a generatív algoritmusokban rejlő, ténylegesen hasznos képességeket. Egy ilyen terület a gépi fordítás, amely az elmúlt években érezhető szintlépést ért el.
Vágod, tesó?
A már 2016-ban is több mint 100 nyelvvel zsonglőrködő Google Translate egy friss blogbejegyzés szerint mostantól a valós idejű fordítások finomítására is bevetik a keresőóriás nagy nyelvi modelljét, a Geminit. Ennek eredményeként az alkalmazás képes lehet az átvitt értelmű mondásokat, idiómákat, vagy éppen szlenghez tartozó kifejezéseket is pontosabban tolmácsolni. A kontextushoz igazodó fordításokat első körben az Egyesült Államokban és Indiában teszi elérhetővé a cég az angol mellett mintegy 20 nyelven.
Ennél bővebb lefedettséggel startol a most bejelentett másik funkció, amellyel a felhasználók közvetlenül a fülhallgatójukba "rendelhetik" a valós idejű fordítást. Az egyelőre béta állapotban lévő fejlesztés az ígéretek szerint teljesen szakít a korábbi, gépies felolvasási stílussal, mivel a Gemini az eredeti beszélő stílusjegyeit is átviszi a tolmácsolás során. Praktikusan tehát megmarad a hangszín, a ritmus és a hangsúlyozás, ezzel is támogatva a megértést. A fülhallgatón keresztüli élő tolmácsolás funkcióval gond nélkül meghallgatható például egy általunk nem ismert nyelven elhangzó konferenciaelőadás, nézhető tévéműsor vagy akár egy teljes film.
Mindezt a cég tájékoztatása alapján első körben az Egyesült Államokban, Mexikóban és Indiában teszik elérhetővé. A funkció bármilyen telefonhoz csatlakoztatott fül- és fejhallgatóval működik, és több mint 70 nyelvet támogat, köztük a magyart is. Az ígértek szerint a szolgáltatás jövőre megjelenik iOS-re, párhuzamosan pedig folyik majd a funkció földrajzi kiterjesztése is.
Almát a körtével
Érdemes megjegyezni, hogy az Apple az idén nyáron bemutatkozó iOS 26 operációs rendszer kapcsán már előállt egy nagyon hasonló szolgáltatással. Az iPhone-tulajdonosok szintén élő fordítást kaphatnak akár szöveges, akár szóbeli társalgásaikhoz, ám mindezt csak néhány támogatott AirPods modellen keresztül élvezhetik, ráadásul a Google portfóliójához képest lényegesen kevesebb nyelven.
Ami pedig a további fejlődési potenciált illeti, abban egyértelműen a Google áll jobban. A keresőóriás a ChatGPT megjelenését követő sokkból viszonylag gyorsan fel tudott rázódni, és immár az OpenAI főhadiszállásán szól a vörös riadó a Gemini fejlett képességei miatt. Az Apple mesterséges intelligenciával kapcsolatos helyzetéről pedig sokat elárul, hogy a témában épp a Google-höz fordultak segítségért.
(kép: Google)
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak