Bárhol is alkalmaztak eddig mesterségesintelligencia-algoritmusokat az emberek megfigyelésére és azonosítására, szinte minden alkalommal az derült ki, hogy az algoritmusok is előítéletesen döntenek. Az IBM most olyan oktató adatbázist készített arcfelismerő mesterséges intelligenciáknak (MI), amely píszívé nevelné a különböző megoldásokat. Ez újabb fontos lépés a tavaly ősszel bemutatott előítélet-detektáló, az AI Fairness 360 felhős szolgáltatás után. A most elérhetővé tett Diversity in Faces (DiF) adatbázis célja, hogy kellően sokszínű mintát biztosítson, melyekkel pontosabban működő adatmodellek készíthetők.
Mint a vállalat közleménye írja, az MI annál pontosabb modellt tud készíteni, minél több adatot tud feldolgozni az adatvezérelt mélytanulás során. Ám ennek során jelentkezik az a probléma, ami a bigdata-elemzéseknek is az egyik rákfenéje: nagyobb a torzítás veszélye, mint a súlyozott reprezentatív minta használatánál. Ezért kulcsfontosságú annak az adattömegnek a minősége, amit az MI tanítására felhasználnak.
Ahhoz, hogy az arcfelismerés a kívánt módon teljesüljön, olyan adatkészlettel kell tanítani az MI-t, ami kellően nagy, és kellően sokrétű, azaz tükrözze a világban megjelenő arcok sokféleségét. Az MI ugyanis csak így képes megtanulni azt, hogy az arcok sokféleképpen lehetnek mások – írják az adatbázis oldalán.
A tanításnál kell megfogni a problémát
Az adatbázis kb. egymillió képet tartalmaz emberi arcokról. A képeket a kutatási célokra létrehozott és az AWS-en elérhető Yahoo Flickr Creative Commons 100M (YFCC100M) adatbázisából nyerték ki egy olyan mesterséges intelligencia segítségével, amely végigment az adatbázisban található mintegy 100 millió fotón, és elkülönítette az arcokat. A továbbiakban ugyanis már csak az arcokról készült fotókat használták fel.
Az adatkészlet összeállításához meghatároztak olyan kraniofaciális (koponyára és arcra vonatkozó formai) jellemzőket, mint például a fejhossz, az orrhossz, a homlokmagasság vagy az arc szimmetriajellemzői, melyek alapján objektív tipológiát lehet készíteni. Ezt egészítették ki olyan információkkal, mint az életkor vagy a nem. (Az adatbázis létrehozását megelőző kutatási programnak van egy vékonyka magyar szála: felhasználták a modern kraniofaciális antropometria úttörőjének, a felvidéki Rózsahegyen (ma Ružomberok) 1915-ben született Leslie G. Farkasnak az eredményeit is, aki az arc- és koponyasebészeti beavatkozások tökéletesítéséhez kezdett el foglalkozni a témával.)
A DiF metaadataihoz mindent mérnek, ami mérhető
A DiF-be került egymillió kép mindegyikéhez tartozik egy metaadatkészlet, egy "faceprint", amely pontosan leírja a fejre vonatkozó jellemzőket. Emellett – és ez a DiF igazi újdonsága – a metaadatok közé bekerül, hogy a mérhető tulajdonságok hogyan kapcsolódnak egymáshoz. Megadják a mért jellemzők egymástól való távolságát, vagy a szem fölötti és az orr alatti terület arányát, pontos információkat tartalmaz a bőr színéről, az árnyalatokról stb. Még nemi szempontból is a korrektségre törekedtek: míg korábban lényegében binárisan határozták meg a nemet (valaki vagy nő, vagy férfi), most kidolgoztak egy metrikát, amely egy skálán határozza meg a nőies és férfias jellemzőket.
A szubjektivitást nem sikerült kizárni
A fejlesztők a szubjektív értékelést nem tudták teljesen kizárni. A nőies és férfias jellemzők értékelését és az életkor meghatározását is emberek végezték, ami természetesen ismét visszahozhatja az előítéletek és az azokból eredő torzítások problémáját. Ezt a program vezetője, John R. Smith is elismerte a TechCrunch-nak. Smith szerint azonban a skálás értékelés révén sokkal finomabban lehet kategorizálni, mint például ha csak azt határoznák meg, hogy az adott fotó egy nőről vagy egy férfiról készült.
A kutató másik érve az volt, hogy a DiF jelenlegi állapota közel sem a végleges, hiszen még egymillió fotóval sem garantálható, hogy az adatkészlet valóban reprezentatív az általános felhasználáshoz, és hogy kiszűrje az előítéletesség lehetőségét. Smith szerint a továbblépést az segítheti, ha az egyelőre kizárólag kutatási célokra használható adatbázis körül. A közös tudással lehet majd lépésről lépésre finomítani az adatokat.
A kutatási terület azonban nagyon fontos, hiszen már ma is számos területen használnak élesben arcfelismerő algoritmusokat. Alkalmazzák például biometrikus azonosításhoz telefonon, intelligens ajtózáraknál, sőt Kínában már azt is kutatják, hogy az arc jellemzőiből hogyan azonosítható a bűnözésre való hajlam. De hogy valami valóban jó célt is mondjunk, egy előítéletektől mentes algoritmus még a ritka betegségek arcról történő azonosításában is sokat segíthet.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak