A közösségi oktopusz új fordítója sokkal több nyelvpárt képes kezelni a jelenleg alkalmazott, mesterséges intelligencián alapuló megoldásokhoz képest. Ráadásul a vizsgálatok szerint jobb munkát is végez.

A Facebok anyavállalata tegnap jelentette be egy blogposztban a No Language Left Behind (kb. Egy nyelv sem marad az út szélén) elnevezésű fordítóprogramját, amely a cég állítása szerint minden tekintetben lepipálja a hasonló alkalmazásokat. A mesterséges intelligenciára támaszkodó algoritmus legfontosabb tulajdonsága, hogy összesen 200 különböző nyelvvel képes megbirkózni bármilyen kombinációpárban.

Lefednék a peremvidéket

Az MI-modell portfólióját gazdagítja többek között 55 afrikai nyelv is, ami azért különösen fontos, mivel általában a forditóprogramok fejlesztői a legtöbbek által beszélt, elterjedt nyelvekre fókuszálnak. A világ nagyjából 5 milliárd főre tehető internetező közössége viszont összesen több mint 7000 nyelven képes kommunikálni. Azok számára, akik nem beszélnek jól valamilyen világnyelvet, kulcsfontosságú lehet egy olyan automatizált fordítóprogram, amellyel képesek lesznek a világhálón meglévő tartalmakat legalább alapszinten megérteni. De egy megfelelő minőségű fordítás esetén még azok számára is hasznos, akik ugyan tudnak elterjedt nyelveken, ám jobban szeretnék anyanyelvükön olvasni a szövegeket.

A cég kutatási eredményekre hivatkozva állítja, hogy modellje a hasonló megoldásokkal összehasonlítva átlagosan 44 százalékkal javítja a fordítások minőségét. Utóbbi számszerűsítésére a Meta az automatikus metrikus értékelési rendszer mellett emberi "zsűrit" is bevetett.

Mindenhol hasznosítható

A Meta természetesen az NLLB-t alapból saját termékei fejlesztésére igyekszik felhasználni. Saját becslések szerint a modell naponta több mint 25 milliárd fordítás elkészítésével támogatja majd a felhasználók közötti kommunikációt. A cégcsoport platformjain meglévő tartalmak lefordítása és a hirdetések minőségének javítása mellett az algoritmust a káros tartalmak és a dezinformációnak minősülő bejegyzések kiszűrésére is igyekeznek felhasználni. 

A lehetőségek azonban nem állnak meg a Meta kapujában, a vállalat ugyanis nyílt forráskódként megosztja a modellt a szélesebb szakmai közönséggel. A szakembereknek így lehetőségük lesz az algoritmus felhasználásával egyéb alkalmazásokban is kamatoztatni a képességeit. Az NLLB-200 modelleken túl a vállalat a tanításhoz használt FLORES-200 adatkészletet, valamint a modellek képzési kódját és a képzési adatkészlet újbóli létrehozásához szükséges kódot is elérhetővé teszi a fejlesztők számára.

Sőt, a cég a modell felhasználását akár 200 ezer dolláros támogatással is megtoldja, amennyiben a munka olyan kutatók és nonprofit szervezetekhez köthető, amelyek a fenntarthatóságot, az élelmezésbiztonságot, a nemi alapú erőszak elleni küzdelemet, az oktatás fejlesztését vagy más, az ENSZ fenntartható fejlődési céljait támogató területeket igyekeznek munkájukkal segíteni.

Végezetül a Meta partnerségre lépett a Wikimedia Alapítvánnyal, hogy a Wikipédia fordítórendszereinek javításán dolgozzanak együtt. A Wikipédiának több mint 300 nyelven vannak elérhető tartalmai, de a legtöbbjüknek jóval kevesebb szócikke van, mint az angol nyelvű témáknak, amelyek száma ma már több mint 6 millióra tehető.

Cloud & big data

Egyre furcsábbak lesznek a CAPTCHA tesztek, ahogy a gépek is okosodnak

Már nagyon jók például például a fényképek címkézésében, de a logikai összefüggéseken könnyen fennakadnak. Igaz, ezzel így lehet némelyik emberi felhasználó is.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.