Ledobta az atomot az MI egyik ágára a Microsoft Research kutatója

Bitport2021.05.10.Cloud & big data

Kate Crawford alapjaiban kérdőjelezi meg, hogy az MI képes azonosítani az érzelmeket. Szerinte már a kiindulópont is téves. Csakhogy ez már egy több tízmilliárdos ipar.

Rengeteg, eleddig ígéretesnek tűnő (és vastag dollármilliókkal finanszírozott) fejlesztést nullázhat le a Microsoft Research egyik kutatója. Már ha kételyeit bárki is komolyan veszi, és nem indul be a befektetőknél a kognitív disszonancia. Kate Crawford (egyébiránt ausztrál író, zeneszerző, előadó, producer, újságíró, egyetemi oktató, MI-szakértő – a későbbiekben az egyszerűség kedvéért: jövőkutató) szerint egy olyan elméletre alapozták, hogy a mesterséges intelligenciát (MI) meg lehet tanítani az érzelmek felismerésére, amit soha nem sikerült bizonyítani. Az eredmény pedig nem sokban különbözik attól, ameddig a frenológusok eljutottak.

De a kognitív disszonancia működésbe lépésére nagy az esély. A Crawford által megkérdőjelezett elméletre ugyanis állami és magáncégek globálisan dollármilliárdokat égettek el, bombasztikus(nak hangó) szolgáltatásokat építettek rá... Ezt pedig senki sem akarja veszni hagyni.

Mindenki benne van nyakig

Kate Crawford abban az áprilisban megjelent könyvében foglalkozik a témával, melyben az MI társadalmi hatását vizsgálja (Atlas of AI, Yale University Press 2021). A könyv nyomán született írását a The Atlantic c. folyóirat közölte.

A cikkben Crawford a gyökerekig visszafejti, hol csúszott félre ez a történet. Az ősbűnt egy amerikai pszichológus, Paul Ekman követte el, aki Pápua Új-Guineában egy a külvilágtól elzártan élő törzs tagjainak körében igyekezett bizonyítani azt a hipotézist, hogy az emberi arc az univerzális érzelmeket (öröm, nyugalom, félelem, undor stb.) rassztól, körülményektől stb. függetlenül ugyanúgy fejezi ki (a tudós két fontosabb munkája is megjelent magyarul). Ekman azzal a meggyőződéssel tért vissza az USA-ba, hogy sikerrel járt. Elméletet gyorsan elfogadta a szakma, és olyannyira beépült az technológiai iparba, hogy Cerawford szerint 2024-re egy 56 milliárdos piac épül rá.

Ebben a piacban mindenki benne van nyakig. Az ugyanis hatalmas terét adná a befolyásolási szándékoknak (pl. egy reklámmal), ha az MI egy személyt nem csak azonosítani képes az arca alapján, hanem egyből azt is tudná, milyen érzelmi állapotban van. Crawford legsúlyosabb állítása az, hogy ezek a rendszerek már most működnek, és hatnak ránk, befolyásoljak mindennapi életünket annak ellenére, hogy hiányoznak a működésükre vonatkozó alapvető tudományos bizonyítékok.

Van például olyan toborzó cég, a HireVue (ügyfele többek között a Goldman Sachs, az Intel, az Unilever...), amely érzelemfelismerő algoritmussal (arc- és hangszínelemzés alapján) mérte fel, hogy egy jelölt alkalmas-e egy adott munkára (a rendszerről itt írtunk). Az Apple 2016-ban felvásárolta az Emotient nevű stratupot, mert annak szoftvere állítólag képes volt az érzelmeket azonosítani képekből. A piacnak azonban lett új üdvöskéje, a bostoni Affectiva, amely egy a MIT-en verbuválódott kutatócsapatból nőtt ki. Az Affectiva felépítette a világ legnagyobb érzelemadatbázisát, ami lényegében egy monumentális videógyűjtemény emberi arckifejezésekről. (A cég egyik alkalmazásáról itt írtunk.)

De érdekelt az Amazon (a sok botrányt kavart Rekongnition révén), a Microsoft (Face API). A megoldás beépült a mindennapjainkba. Használja a nemzetbiztonság, a repülőterek utasellenőrzésre stb. Az IKT cégeknek pedig óriási alapanyag-utánpótlást biztosítanak az algoritmusaik tanításához a közösségi oldalak (Instagram-szelfik, Tiktok-videók, Flickr, Pinterest stb.).

Fordítsuk meg a dolgot: nem igaz az elmélet

Ezek a rendszerek mind Ekman alaptételéből indulnak ki: az érzelemkifejezés univerzális, és arcunk önkéntelenül felfedi, hogy mit érzünk, azt pedig a gépek képesek azonosítani. Ez szinte hittétel gyanánt ivódott be az érdekeltekbe, így senki sem meri megkérdőjelezni.

Crawford viszont felteszi a kérdést: mi van akkor, ha Ekman tétele nem igaz? Pontosabban: mi bizonyítja, hogy igaz? Egyelőre ugyanis nem sok tudományos bizonyíték van Ekman állításainak igazolására. Ráadásul több kritikusa a kutatási eredmények publikálásakor rámutatott az elmélet gyenge pontjaira. (Crawford cikkében részletesen levezeti, hogyan jutott el az elmélet miszerint a fizikai külsőből levezethető az ember lelkiállapota, Arisztotelész kezdetleges fiziognómiájától a 19. századi frenológián át Ekmanig, majd a pszichológus eredményeire építő DARPA-projekteken át a mai MI-kutatásokig.)

Crawford szerint az érzelemfelismerő algoritmusok fejlesztésénél az alapvető kulturális és szociális eltéréseket sem veszik figyelembe. Ehelyett leegyszerűsítik a kérdést az arcmozgásra: ha így mozog, az ilyen érzelemre, ha úgy, az meg olyan érzelemre utal(hat). Csakhogy az érzelemkifejezésben jelentősek a kulturális hatások, azaz univerzális formulákkal az MI nem megy semmire. Crawford erre példaként egy olyan rendszert hoz fel, amit a 2001-es New York-i terrortámadás, a 9/11 után fejlesztettek. A rendszernek a negatív érzelmek (stressz, félelem stb.) alapján kellett volna potenciális terroristákat kiszúrni. Elköltöttek rá 900 millió dollárt, és sohasem működött.

Crawford szerint az érzelemfelismerés automatizálása nagyjából a fajelméletnek is erős tápot adó frenológia szintjén áll, és legalább olyan veszélyes is.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Minden orosz okostelefonon megjelenik az állami hátterű üzenetküldő app

Miután a Telegram és a WhatsApp funkcióit már korlátozták, szeptembertől kötelező lesz az új készülékre telepíteni a Gazprom által irányított VKontakte saját alkalmazását.

A hónap témája

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.

CIO Podcast

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Minden orosz okostelefonon megjelenik az állami hátterű üzenetküldő app

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2025 konferencia