A keresőóriás megsokszorozná a világon beszélt nyelvek feldolgozásával kapcsolatos, jelenleg sem szerény képességeit.
Hirdetés
 

Egy New Yorkban tegnap tartott mesterséges intelligenciára fókuszáló rendezvényén jelentette be a Google az úgynevezett 1000 Languages Initiative-et. A kezdeményezés nevében hordozza célját, ami egy olyan MI-modell létrehozása, amely képes megérteni és feldolgozni a világ ezer leggyakrabban beszélt nyelvét. 

Az erről, illetve általában a mesterséges intelligenciában rejlő lehetőségekről kiadott blogposztban a vállalat vezető munkatársa arról ír, hogy a nyelv a legfontosabb kommunikációs eszközünk, ám miközben világszerte több mint 7000 nyelvet beszélnek az emberek, ezek elenyésző része van "rendesenl reprezentálva" az interneten. Utóbbi alapvetően megnehezíti a gépi fordítást végző programok dolgát, hiszen ezeket az algoritmusokat hatalmas mennyiségű adattömegre támaszkodva fejlesztik, ami nem áll rendelkezésre a kisebb (de potenciálisan akár több millió embert is kitevő) népességek által használt nyelvek, nyelvjárások esetében.

A helyzet orvoslására a keresőóriás kutatói kifejlesztettek egy univerzális beszédmodellt (Universal Speech Model, USM), amelyet több mint 400 nyelvre képeztek ki, így ez a cég állítása szerint az eddigi legnagyobb lefedettségű beszédmodellnek tekinthető. A készlet kibővítésére a Google folyamatosan keresi az együttműködési lehetőségeket a világ különböző közösségeivel, hogy hozzájuthasson a szükséges adatkészletéhez a még nem lefedett nyelvek esetében is.

A cég témával kapcsolatos erőfeszítéseit a legtöbben a Google Translate/Fordító szolgáltatáson keresztül tapasztalhatták meg a gyakorlatban. A vállalat hosszú évek óta csiszolja nyelvi feldolgozási technológiáját, hogy aztán azt a fülhallgatóktól kezdve a YouTube automatikusan generált feliratozásáig portfóliója számos eleménél kamatoztathassa.

Mások sem tétlenkednek

A Google-lel több fronton is riválisként küzdő Meta épp a nyáron jelentette be szándékát, miszerint egyetlen nyelvet sem hagy az út szélén. A Facebok anyavállalatának új fordítóprogramja a cég állítása szerint minden tekintetben lepipálja a hasonló alkalmazásokat. A mesterséges intelligenciára támaszkodó algoritmus legfontosabb tulajdonsága, hogy összesen 200 különböző nyelvvel képes megbirkózni bármilyen kombinációpárban. Köztük van több tucat olyan afrikai nyelv is, amelyet a jelenleg széles körben használt fordítóeszközök egyike sem támogat.

Ráadásul a témával kapcsolatos kutatások újabb eredményeket hoztak ősszel. A Meta munkatársainak sikerült MI-alapú beszéd-beszéd fordítórendszert készíteni a hokkienhez. Ez egy elsősorban szóbeli kínai nyelvjárás, amit a szakemberek kvázi esettanulmányként használnának az univerzális beszédfordító megalkotásához.

Cloud & big data

A vízalatti robotflották kommunikációjában készül nagy dobásra egy izraeli startup

A Skana Robotics SeaSphere szoftvere egy régi problémát oldana meg a felszín alatt működő, pilóta nélküli járművek valós idejű adatmegosztásának biztosításával.
 
Hirdetés

Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai

Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.

Sok szervezet adatvezéreltnek tartja magát, mert van BI rendszere és heti dashboardja. A valóságban azonban ennél többről van szó; a kérdés ugyanis nem az, hogy van-e elég adat, hanem, hogy mennyire jól használják a döntések meghozatalához.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.