Kate Crawford alapjaiban kérdőjelezi meg, hogy az MI képes azonosítani az érzelmeket. Szerinte már a kiindulópont is téves. Csakhogy ez már egy több tízmilliárdos ipar.

Rengeteg, eleddig ígéretesnek tűnő (és vastag dollármilliókkal finanszírozott) fejlesztést nullázhat le a Microsoft Research egyik kutatója. Már ha kételyeit bárki is komolyan veszi, és nem indul be a befektetőknél a kognitív disszonancia. Kate Crawford (egyébiránt ausztrál író, zeneszerző, előadó, producer, újságíró, egyetemi oktató, MI-szakértő – a későbbiekben az egyszerűség kedvéért: jövőkutató) szerint egy olyan elméletre alapozták, hogy a mesterséges intelligenciát (MI) meg lehet tanítani az érzelmek felismerésére, amit soha nem sikerült bizonyítani. Az eredmény pedig nem sokban különbözik attól, ameddig a frenológusok eljutottak.

De a kognitív disszonancia működésbe lépésére nagy az esély. A Crawford által megkérdőjelezett elméletre ugyanis állami és magáncégek globálisan dollármilliárdokat égettek el, bombasztikus(nak hangó) szolgáltatásokat építettek rá... Ezt pedig senki sem akarja veszni hagyni.

Mindenki benne van nyakig

Kate Crawford abban az áprilisban megjelent könyvében foglalkozik a témával, melyben az MI társadalmi hatását vizsgálja (Atlas of AI, Yale University Press 2021). A könyv nyomán született írását a The Atlantic c. folyóirat közölte.

A cikkben Crawford a gyökerekig visszafejti, hol csúszott félre ez a történet. Az ősbűnt egy amerikai pszichológus, Paul Ekman követte el, aki Pápua Új-Guineában egy a külvilágtól elzártan élő törzs tagjainak körében igyekezett bizonyítani azt a hipotézist, hogy az emberi arc az univerzális érzelmeket (öröm, nyugalom, félelem, undor stb.) rassztól, körülményektől stb. függetlenül ugyanúgy fejezi ki (a tudós két fontosabb munkája is megjelent magyarul). Ekman azzal a meggyőződéssel tért vissza az USA-ba, hogy sikerrel járt. Elméletet gyorsan elfogadta a szakma, és olyannyira beépült az technológiai iparba, hogy Cerawford szerint 2024-re egy 56 milliárdos piac épül rá.

Ebben a piacban mindenki benne van nyakig. Az ugyanis hatalmas terét adná a befolyásolási szándékoknak (pl. egy reklámmal), ha az MI egy személyt nem csak azonosítani képes az arca alapján, hanem egyből azt is tudná, milyen érzelmi állapotban van. Crawford legsúlyosabb állítása az, hogy ezek a rendszerek már most működnek, és hatnak ránk, befolyásoljak mindennapi életünket annak ellenére, hogy hiányoznak a működésükre vonatkozó alapvető tudományos bizonyítékok.

Van például olyan toborzó cég, a HireVue (ügyfele többek között a Goldman Sachs, az Intel, az Unilever...), amely érzelemfelismerő algoritmussal (arc- és hangszínelemzés alapján) mérte fel, hogy egy jelölt alkalmas-e egy adott munkára (a rendszerről itt írtunk). Az Apple 2016-ban felvásárolta az Emotient nevű stratupot, mert annak szoftvere állítólag képes volt az érzelmeket azonosítani képekből. A piacnak azonban lett új üdvöskéje, a bostoni Affectiva, amely egy a MIT-en verbuválódott kutatócsapatból nőtt ki. Az Affectiva felépítette a világ legnagyobb érzelemadatbázisát, ami lényegében egy monumentális videógyűjtemény emberi arckifejezésekről. (A cég egyik alkalmazásáról itt írtunk.)

De érdekelt az Amazon (a sok botrányt kavart Rekongnition révén), a Microsoft (Face API). A megoldás beépült a mindennapjainkba. Használja a nemzetbiztonság, a repülőterek utasellenőrzésre stb. Az IKT cégeknek pedig óriási alapanyag-utánpótlást biztosítanak az algoritmusaik tanításához a közösségi oldalak (Instagram-szelfik, Tiktok-videók, Flickr, Pinterest stb.).

Fordítsuk meg a dolgot: nem igaz az elmélet

Ezek a rendszerek mind Ekman alaptételéből indulnak ki: az érzelemkifejezés univerzális, és arcunk önkéntelenül felfedi, hogy mit érzünk, azt pedig a gépek képesek azonosítani. Ez szinte hittétel gyanánt ivódott be az érdekeltekbe, így senki sem meri megkérdőjelezni.

Crawford viszont felteszi a kérdést: mi van akkor, ha Ekman tétele nem igaz? Pontosabban: mi bizonyítja, hogy igaz? Egyelőre ugyanis nem sok tudományos bizonyíték van Ekman állításainak igazolására. Ráadásul több kritikusa a kutatási eredmények publikálásakor rámutatott az elmélet gyenge pontjaira. (Crawford cikkében részletesen levezeti, hogyan jutott el az elmélet miszerint a fizikai külsőből levezethető az ember lelkiállapota, Arisztotelész kezdetleges fiziognómiájától a 19. századi frenológián át Ekmanig, majd a pszichológus eredményeire építő DARPA-projekteken át a mai MI-kutatásokig.)

Crawford szerint az érzelemfelismerő algoritmusok fejlesztésénél az alapvető kulturális és szociális eltéréseket sem veszik figyelembe. Ehelyett leegyszerűsítik a kérdést az arcmozgásra: ha így mozog, az ilyen érzelemre, ha úgy, az meg olyan érzelemre utal(hat). Csakhogy az érzelemkifejezésben jelentősek a kulturális hatások, azaz univerzális formulákkal az MI nem megy semmire. Crawford erre példaként egy olyan rendszert hoz fel, amit a 2001-es New York-i terrortámadás, a 9/11 után fejlesztettek. A rendszernek a negatív érzelmek (stressz, félelem stb.) alapján kellett volna potenciális terroristákat kiszúrni. Elköltöttek rá 900 millió dollárt, és sohasem működött.

Crawford szerint az érzelemfelismerés automatizálása nagyjából a fajelméletnek is erős tápot adó frenológia szintjén áll, és legalább olyan veszélyes is.

Cloud & big data

Mégsem annyira önálló a Sora videógenerátor, mint ahogy azt gondolnánk

Az egyik népszerű Sora-klip kapcsán újra kiderült, hogy a mesterséges intelligencia sosem annyira penge, mint ahogy azt a fejlesztők el akarják hitetni a közönséggel.
 
Hirdetés

Biztonságos M2M kommunikáció nagyvállalti környezetben a Balasystól

A megnövekedett támadások miatt az API-k biztonsága erősen szabályozott és folyamatosan auditált terület, amelynek védelme a gépi kommunikáció (M2M) biztonságossá tételén múlik.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.