Alig két hónapja cserélte le a Google a fordítási feladatokért felelős rendszerét. A korábbi, leginkább a szótárak szintjén elboldoguló algoritmust egy modern, öntanulásra képes verzió váltotta fel. A cég szakemberei maguk is meglepődve tapasztalták, mikre képes a mesterséges intelligencia.
Felfedezetlen terepen
Hagyományosan a szótárprogramok alapját egy meglehetősen egyszerű felállás adja: a különböző nyelvek szavait, szókapcsolatait, gyakori szófordulatait egymáshoz rendelik. A megoldás természetesen meg sem közelíti az emberi fordítók teljesítményét, de nagyon alapvető mondatoknál nagyjából elfogadható eredményt hoz.
A Google Translate-tel sem volt érdemes eddig bekezdéseket fordíttatni, de szeptemberben alapos turbózáson esett át a szolgáltatás, amikor a vállalat mélytanulásra alkalmas algoritmusa vette át a feladatokat. Az emberi idegrendszer működését másoló rendszer azonnal megmutatta erényeit, hiszen például mandarin nyelven az elődjénél sokkal pontosabb szövegeket produkált.
Azt is tudja, amire meg se tanították
A Google szolgáltatása jelenleg 103 nyelven működik, ami azt jelenti, hogy a direkt fordításra kijelölt nyelvpárok számossága bőven meghaladja az ötezret. Ha ez utóbbit felszorozzuk a megtanulandó szavak, szókapcsolatok, példák millióival (mert valamiből az öntanuló rendszernek is ki kell indulnia), irdatlanul nagy adatmennyiséget kapunk. Viszont a mérnökök felfedezték, hogy nem feltétlenül szükséges minden egyes lehetséges nyelvi párt beadagolni a gépnek, hiszen az feltalálja magát, és egészen elfogadható eredményt ad akkor is, ha csak áttételes ismeretei vannak egy adott nyelvpárról.
A rendszert külön megtanították az angol-japán és az angol-koreai fordításra, majd kipróbálták, mire megy, ha arra kérik, fordítson japánról koreaira. Még a fejlesztők is megdöbbentek, hogy mennyire jó minőségű lett a fordítás a gép által sosem tanult felállásban. A mesterségesen működő neurális háló bonyolultságára jellemző, hogy még magik a kutatók sem tudják teljes bizonyossággal megmondani, hogy is működhet mindez úgy, ahogy tapasztalták.
Így "gondolkodik" a mesterséges intelligencia
(a kép kattintásra nagyítható)
Némi nyomra azért bukkantak. Felállítottak egy 3D-s grafikont, ami kis túlzással a gép "gondolkodását" rajzolja ki a különböző fordítási feladatok és a három nyelv viszonylatában. Kiderült, hogy az algoritmus a hasonló kifejezéseket, mondatokat ugyanazon a területen csoportosítja, legyen szó bármelyik nyelvről is. Ebből az következik, hogy a szavak gépies átírása helyett a program képes a jelentésük alapján elhelyezni bizonyos szókapcsolatokat, bár erre explicite nem tanították meg.
Erre a trükkre vezethető vissza az a másik kísérlet eredménye is, ahol a gépnek 12 nyelvpárt tanítottak meg, de csak annyi adattal, amennyi normál esetben egyetlen nyelvpár elsajátításához szükséges. A gép viszont ebből a leszűkített alapból is majdnem olyan jó minőségű fordításokat produkált, mint a 12-szer akkora tudásanyagra építve.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak