A Google Translate mögött munkába álló új algoritmus olyat is lefordít, amit meg sem tanítottak neki.

Alig két hónapja cserélte le a Google a fordítási feladatokért felelős rendszerét. A korábbi, leginkább a szótárak szintjén elboldoguló algoritmust egy modern, öntanulásra képes verzió váltotta fel. A cég szakemberei maguk is meglepődve tapasztalták, mikre képes a mesterséges intelligencia.

Felfedezetlen terepen

Hagyományosan a szótárprogramok alapját egy meglehetősen egyszerű felállás adja: a különböző nyelvek szavait, szókapcsolatait, gyakori szófordulatait egymáshoz rendelik. A megoldás természetesen meg sem közelíti az emberi fordítók teljesítményét, de nagyon alapvető mondatoknál nagyjából elfogadható eredményt hoz.

A Google Translate-tel sem volt érdemes eddig bekezdéseket fordíttatni, de szeptemberben alapos turbózáson esett át a szolgáltatás, amikor a vállalat mélytanulásra alkalmas algoritmusa vette át a feladatokat. Az emberi idegrendszer működését másoló rendszer azonnal megmutatta erényeit, hiszen például mandarin nyelven az elődjénél sokkal pontosabb szövegeket produkált.

Azt is tudja, amire meg se tanították

A Google szolgáltatása jelenleg 103 nyelven működik, ami azt jelenti, hogy a direkt fordításra kijelölt nyelvpárok számossága bőven meghaladja az ötezret. Ha ez utóbbit felszorozzuk a megtanulandó szavak, szókapcsolatok, példák millióival (mert valamiből az öntanuló rendszernek is ki kell indulnia), irdatlanul nagy adatmennyiséget kapunk. Viszont a mérnökök felfedezték, hogy nem feltétlenül szükséges minden egyes lehetséges nyelvi párt beadagolni a gépnek, hiszen az feltalálja magát, és egészen elfogadható eredményt ad akkor is, ha csak áttételes ismeretei vannak egy adott nyelvpárról.

A rendszert külön megtanították az angol-japán és az angol-koreai fordításra, majd kipróbálták, mire megy, ha arra kérik, fordítson japánról koreaira. Még a fejlesztők is megdöbbentek, hogy mennyire jó minőségű lett a fordítás a gép által sosem tanult felállásban. A mesterségesen működő neurális háló bonyolultságára jellemző, hogy még magik a kutatók sem tudják teljes bizonyossággal megmondani, hogy is működhet mindez úgy, ahogy tapasztalták. 

 

Így "gondolkodik" a mesterséges intelligencia
(a kép kattintásra nagyítható)

 

Némi nyomra azért bukkantak. Felállítottak egy 3D-s grafikont, ami kis túlzással a gép "gondolkodását" rajzolja ki a különböző fordítási feladatok és a három nyelv viszonylatában. Kiderült, hogy az algoritmus a hasonló kifejezéseket, mondatokat ugyanazon a területen csoportosítja, legyen szó bármelyik nyelvről is. Ebből az következik, hogy a szavak gépies átírása helyett a program képes a jelentésük alapján elhelyezni bizonyos szókapcsolatokat, bár erre explicite nem tanították meg. 

Erre a trükkre vezethető vissza az a másik kísérlet eredménye is, ahol a gépnek 12 nyelvpárt tanítottak meg, de csak annyi adattal, amennyi normál esetben egyetlen nyelvpár elsajátításához szükséges. A gép viszont ebből a leszűkített alapból is majdnem olyan jó minőségű fordításokat produkált, mint a 12-szer akkora tudásanyagra építve.

Cloud & big data

Nem sok mindenkit érdekel az Apple szuperszemüvege

A beszámolók alapján elolvadt az érdeklődés a Vision Pro headsetek iránt, az Apple néhány üzletében szinte nem is keresik a gyártó legújabb hardveres termékét.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.