A Facebook anyacégénél kifejlesztettek egy MI-alapú beszéd-beszéd fordítórendszert a hokkienhez, egy elsősorban szóbeli kínai nyelvjáráshoz, amit esettanulmányként használnának az univerzális beszédfordító megalkotásához.

A szövegfelismerés a mesterséges intelligencia gyorsan fejlődő területe, melynek kézenfekvő alkalmazása a különböző nyelveket beszélő emberek közötti kommunikáció elősegítése, de számos más területen is hasznosnak bizonyul, mint amilyen mondjuk a megosztott dokumentumok és a hang alapú beszélgetések közvetlen fordítása. Ebbe a sorba illeszkedik a Meta Platforms MI-kutató részlegének (Meta AI) szerdai bejelentése, amely szerint elindították univerzális beszédfordító (universal speech translator, UST) projektjüket, megcélozva a valós idejű, tisztán hangalapú fordítást még az olyan nyelvek között is, amelyek nem igazán hozzáférhetőek írott formában.

A Meta vezérigazgatója, Mark Zuckerberg azt is közölte, hogy megnyitják a maga nemében még egyedülálló megoldás forrását, hogy azt minél több felhasználó vehesse igénybe minél több nyelv esetében. A Meta szerint az UST az első olyan, mesterséges intelligenciára épülő beszédfordító rendszer, amelyik megbirkózik például a hokkien nyelvvel, a Tajvanon, Kína délkeleti részén és az ázsaiai kínai diaszpórában is beszélt min egyik dialektusával. Bár a nyelvet több tízmillióan értik és beszélik, a valós idejű gépi feldolgozása nem könnyű feladat, mert ellentétben mondjuk az írásban is gyakran használt mandarin nyelvvel, a hokkien túlnyomórészt verbális.
 


A modell fejlesztői azonban a Meta közlése szerint megoldották, hogy a hokkient használók zökkenőmentesen beszéljenek az angol nyelvet használókkal, amit jelentős mérföldkőnek tartanak a globális nyelvi akadályok lebontásában. A Meta szerint a mai MI-alapú fordítási modellek a széles körben beszélt írott nyelvekre összpontosítanak, és nem fedik le az elsősorban szóban élő nyelvek több mint 40 százalékát. Az UST projekt a Meta AI-nak azokra az egyetemes beszéd-beszéd fordítási kutatásaira épít, amelyek az ilyen, értelemszerűen az interneten sem gyakori nyelveket érintik, és három kritikus, a fordítórendszerek előtt álló kihívás leküzdésére koncentrál.

Az első az adathiány, amit nem csak adatgyűjtéssel, de új módszerek alkalmazásával igyekeznek kezelni a már rendelkezésre álló adatok hasznosításában. A modellezésben további kihívásokat jelent az is, hogy egyre több nyelvet kell párhuzamosan kiszolgálni, ezen felül hatékonyabbá kell tenni az eredmények értékelését és javítását. A projekt során kutatják a nagy, címkézetlen beszédadatkészletekből való automatikus adatbányászatot az úgynevezett pszeudocímkézés alkalmazását is a gyengén ellenőrzött adatkészletek előállításánál. A hokkien feldolgozása esettanulmányként szolgál egy új, végpontok közötti megoldáshoz a képzési adatgyűjtéstől és a modellezési lehetőségektől az adatkészletek benchmarkolásáig.

A fejlesztés részletei a Meta bejelentésében »

Cloud & big data

Az Nvidia vezetője félreérti, mitől lesz visszautasíthatatlan egy ajánlat

Máshol csak a pénztártól való távozás után nem fogadják el a reklamációt, de Jensen Huang már azt is teljes tévedésnek tartja, ha valaki nem jön be nézelődni az MI-boltba.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.