Píszí tankönyvet kaptak az arcfelismerő mesterséges intelligenciák

Bitport2019.01.30.Cloud & big data

Az IBM olyan arcgyűjteményt készített, amely segít a mesterséges intelligencia torzításainak csökkentésében. Egyelőre kutatási célra szánják.

Bárhol is alkalmaztak eddig mesterségesintelligencia-algoritmusokat az emberek megfigyelésére és azonosítására, szinte minden alkalommal az derült ki, hogy az algoritmusok is előítéletesen döntenek. Az IBM most olyan oktató adatbázist készített arcfelismerő mesterséges intelligenciáknak (MI), amely píszívé nevelné a különböző megoldásokat. Ez újabb fontos lépés a tavaly ősszel bemutatott előítélet-detektáló, az AI Fairness 360 felhős szolgáltatás után. A most elérhetővé tett Diversity in Faces (DiF) adatbázis célja, hogy kellően sokszínű mintát biztosítson, melyekkel pontosabban működő adatmodellek készíthetők.

Mint a vállalat közleménye írja, az MI annál pontosabb modellt tud készíteni, minél több adatot tud feldolgozni az adatvezérelt mélytanulás során. Ám ennek során jelentkezik az a probléma, ami a bigdata-elemzéseknek is az egyik rákfenéje: nagyobb a torzítás veszélye, mint a súlyozott reprezentatív minta használatánál. Ezért kulcsfontosságú annak az adattömegnek a minősége, amit az MI tanítására felhasználnak.

Ahhoz, hogy az arcfelismerés a kívánt módon teljesüljön, olyan adatkészlettel kell tanítani az MI-t, ami kellően nagy, és kellően sokrétű, azaz tükrözze a világban megjelenő arcok sokféleségét. Az MI ugyanis csak így képes megtanulni azt, hogy az arcok sokféleképpen lehetnek mások – írják az adatbázis oldalán.

A tanításnál kell megfogni a problémát

Az adatbázis kb. egymillió képet tartalmaz emberi arcokról. A képeket a kutatási célokra létrehozott és az AWS-en elérhető Yahoo Flickr Creative Commons 100M (YFCC100M) adatbázisából nyerték ki egy olyan mesterséges intelligencia segítségével, amely végigment az adatbázisban található mintegy 100 millió fotón, és elkülönítette az arcokat. A továbbiakban ugyanis már csak az arcokról készült fotókat használták fel.

Az adatkészlet összeállításához meghatároztak olyan kraniofaciális (koponyára és arcra vonatkozó formai) jellemzőket, mint például a fejhossz, az orrhossz, a homlokmagasság vagy az arc szimmetriajellemzői, melyek alapján objektív tipológiát lehet készíteni. Ezt egészítették ki olyan információkkal, mint az életkor vagy a nem. (Az adatbázis létrehozását megelőző kutatási programnak van egy vékonyka magyar szála: felhasználták a modern kraniofaciális antropometria úttörőjének, a felvidéki Rózsahegyen (ma Ružomberok) 1915-ben született Leslie G. Farkasnak az eredményeit is, aki az arc- és koponyasebészeti beavatkozások tökéletesítéséhez kezdett el foglalkozni a témával.)

A DiF metaadataihoz mindent mérnek, ami mérhető

A DiF-be került egymillió kép mindegyikéhez tartozik egy metaadatkészlet, egy "faceprint", amely pontosan leírja a fejre vonatkozó jellemzőket. Emellett – és ez a DiF igazi újdonsága – a metaadatok közé bekerül, hogy a mérhető tulajdonságok hogyan kapcsolódnak egymáshoz. Megadják a mért jellemzők egymástól való távolságát, vagy a szem fölötti és az orr alatti terület arányát, pontos információkat tartalmaz a bőr színéről, az árnyalatokról stb. Még nemi szempontból is a korrektségre törekedtek: míg korábban lényegében binárisan határozták meg a nemet (valaki vagy nő, vagy férfi), most kidolgoztak egy metrikát, amely egy skálán határozza meg a nőies és férfias jellemzőket.

A szubjektivitást nem sikerült kizárni

A fejlesztők a szubjektív értékelést nem tudták teljesen kizárni. A nőies és férfias jellemzők értékelését és az életkor meghatározását is emberek végezték, ami természetesen ismét visszahozhatja az előítéletek és az azokból eredő torzítások problémáját. Ezt a program vezetője, John R. Smith is elismerte a TechCrunch-nak. Smith szerint azonban a skálás értékelés révén sokkal finomabban lehet kategorizálni, mint például ha csak azt határoznák meg, hogy az adott fotó egy nőről vagy egy férfiról készült.

A kutató másik érve az volt, hogy a DiF jelenlegi állapota közel sem a végleges, hiszen még egymillió fotóval sem garantálható, hogy az adatkészlet valóban reprezentatív az általános felhasználáshoz, és hogy kiszűrje az előítéletesség lehetőségét. Smith szerint a továbblépést az segítheti, ha az egyelőre kizárólag kutatási célokra használható adatbázis körül. A közös tudással lehet majd lépésről lépésre finomítani az adatokat.

A kutatási terület azonban nagyon fontos, hiszen már ma is számos területen használnak élesben arcfelismerő algoritmusokat. Alkalmazzák például biometrikus azonosításhoz telefonon, intelligens ajtózáraknál, sőt Kínában már azt is kutatják, hogy az arc jellemzőiből hogyan azonosítható a bűnözésre való hajlam. De hogy valami valóban jó célt is mondjunk, egy előítéletektől mentes algoritmus még a ritka betegségek arcról történő azonosításában is sokat segíthet.

Cloud & big data

Földbe állította a PC-piacot a memória drágulása

A második negyedéves eladások közel 5 százalékkal maradtak el az egy évvel ezelőtti teljesítménytől. A recesszió fő oka a kulcsfontosságú alkatrészek árának drámai emelkedése.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Földbe állította a PC-piacot a memória drágulása

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!