A magyar nyelvnek és a Google fordítószolgáltatásnak a viszonyát boncolgatta a Reddit egyik népszerű beszélgetése. Aztán kiderült, ez nem is csak magyar probléma.

Magyar szempontból is érdekes beszélgetés indult a Redditen a Google Translate előítéletességéről. Egy olvasó próbaként "Ő szép. Ő okos. Ő professzor. Ő asszisztens stb." (lásd mellékelt képet) típusú példamondatokat fordíttatott le angolra a Google online fordítószolgáltatásával. Mivel a magyar nyelvben nincsenek nemek, úgy tűnik, a felhasználó ezt alkalmasnak vélte arra, hogy bizonyítsa: előítéletes a Translate.

És láss csudát! A Google szerint valóban egy férfi (he) okos, olvas, zenél, politikus és professzor, míg egy (she) szép, mosogat, főz, takarít, gyereket nevel és asszisztens (a professzor mellett). Ez sok redditort megihletett, alig egy nappal a kép megosztása után több mint 1600 hozzászólás érkezett. A legtöbben a képben a Translate előítéletességének az egyértelmű bizonyítékát látták.

Lehet, hogy bennünk van a hiba?

Voltak azonban árnyaltabb megközelítések is. Az egyik hozzászóló arra hívta fel a figyelmet, hogy abban az esetben, ha a Translate-nek kell döntenie, mert az "ő" neme nem határozható meg egyértelműen (ahogy a magyarban is), akkor ugyanazt a kifejezést akár kétféleképpen is megadhatja, pl. az első előfordulási helyén nőnek, másik esetben férfinak tekinti az asszisztenst. Ez végül is egy demokratikus döntés a géptől: egy ide, egy oda... (A teljes igazsághoz hozzátartozik, hogy a Google csak akkor dönt az "ő" angol nyelvű neméről, ha ömlesztve kapja ezeket az egyszerű példamondatokat, tehát kvázi szövegként értelmezendó szóhalmazt kell fordítania. Ha ugyanis egyetlen mondatot kap feladatul "Ő táncol", minden esetben korrektül megadja a mondatot a he... és a she... személyes névmással is.)
 

Fent a magyar kísérleti szöveg, ami élénk vitát váltott ki a Redditen, alatta pedig egyetlen mondat fordítása


Egy belgiumi felhasználó szerint sem a Google algoritmusában kell keresni a hibát. Szerinte a fordítóban használt tanulómotor alapvetően korrelációs gépnek tekinthető. Megnézi, hogy milyen alak fordul elő gyakrabban, és abból létrehoz egy szabályt. Ha tehát a magyar szövegeknél, forrásoknál (például beküldött fordításjavaslatok) többször társul a mosogat ige esetében nőnemű alany, akkor a Translate-t is a she-hez társítja a cselekvést, amikor a magyar szöveget angolra fordítja. Magyarán a fordítóprogram csupán a magyar társadalomban élő előítéleteket tükrözi vissza, ahogy azok a nyelvünkben rögzültek.

Amint egy másik hozzászóló meg is jegyezte ezzel kapcsolatban, a mesterséges intelligencia képességeit döntően befolyásolja az az adathalmaz, melyen tanítják. (A problémával többször is foglalkoztunk, az IBM előítélet-detektáló, -megszüntető kísérleteivel például itt és itt, az MI előítéletességének az általános okaival pedig itt.)

Vagy mégis a Google dolgozik rosszul?

Az egyik finn hozzászóló (a tudomány mai állása szerint nyelvrokonaink) beidézett egy a közelmúltban megjelent finn újságcikket a Kotiliesi című családi magazinból, amely pontosan ezt a problémát feszegeti. Pedig ugye a finnekről az a közvélekedés (előítélet!), hogy nagy hangsúlyt fektetnek a nemek közötti egyenlőségre, nincs vak komondor (vagy ha van, súlyos büntetés vár rá), és asszonyságok is elvétve szaladgálnak Helsinki utcáin. Ennek ellenére a Translate ugyanúgy nőkkel mosogattat, egy férfi beszél, a nők legfeljebb táncolhatnak... De ugye nem lenne Finnország olyan hely, amilyen, ha a magazin ne szegezte volna azonnal a Google-nek a kérdést: hogy is van ez?

A vállalat elismerte (a Google Translate finn-magyar fordítója szerint), hogy mivel a szoftver által használt nyelvi modell milliónyi oldal lefordításán alapul, a fejlesztők szándéka ellenére reprodukálhatja és megerősítheti a nemi sztereotípiákat. Ugyanakkor már dolgoznak olyan modellen, ami ezt kiküszöböli. Korábban egyébként kívülről is beavatkoztak a fordítómotor működésébe, hogy bizonyos szavakat (pl. erőteljes, orvos stb.) hímneműnek, míg másokat (nővér, gyengéd, gyönyörű stb.) nőneműnek tekintsen.

És hogy mi a megoldás? Mint az egyik hozzászóló megjegyezte, a Translate oldalán van egy gomb a fordítási eredmény ablakában, ahol jobb, például előítélet-mentesebb javaslatot lehet beküldeni az adott fordításra. A hozzászólás meglehetősen visszhangtalan maradt. Vajon miért?

Cloud & big data

A YouTube díjat adott magának, mert a szabad véleménynyilvánítás bajnoka

Na jó, nem a YouTube adta, csak egy a YouTube által szponzorált szervezet egy a YouTube szponzorálta eseményen. És nem a videómegosztó kapta, hanem a vezére.
 
Hirdetés

Három fontos tanács a jövőálló vállalkozások felépítéséhez

A VMware Future Ready Solution megoldásai lehetővé teszik a problémákra adott gyors reakciót, az új körülményekhez való alkalmazkodás és az innováció felgyorsítását is.

A virtualizáció nem válik elavulttá a konténerizació és a Kubernetes miatt, sőt katalizátora lehet az új techológiák bevezetésének.

a melléklet támogatója a Tech Data

A KPMG immár 22. alkalommal kiadott CIO Survey jelentése szerint idén az informatikai vezetők leginkább a digitalizációra, a biztonságra és a szoftverszolgáltatásokra koncentráltak.

Használtszoftver-kereskedelem a Brexit után

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.