Píszí tankönyvet kaptak az arcfelismerő mesterséges intelligenciák

Bitport2019.01.30.Cloud & big data

Az IBM olyan arcgyűjteményt készített, amely segít a mesterséges intelligencia torzításainak csökkentésében. Egyelőre kutatási célra szánják.

Bárhol is alkalmaztak eddig mesterségesintelligencia-algoritmusokat az emberek megfigyelésére és azonosítására, szinte minden alkalommal az derült ki, hogy az algoritmusok is előítéletesen döntenek. Az IBM most olyan oktató adatbázist készített arcfelismerő mesterséges intelligenciáknak (MI), amely píszívé nevelné a különböző megoldásokat. Ez újabb fontos lépés a tavaly ősszel bemutatott előítélet-detektáló, az AI Fairness 360 felhős szolgáltatás után. A most elérhetővé tett Diversity in Faces (DiF) adatbázis célja, hogy kellően sokszínű mintát biztosítson, melyekkel pontosabban működő adatmodellek készíthetők.

Mint a vállalat közleménye írja, az MI annál pontosabb modellt tud készíteni, minél több adatot tud feldolgozni az adatvezérelt mélytanulás során. Ám ennek során jelentkezik az a probléma, ami a bigdata-elemzéseknek is az egyik rákfenéje: nagyobb a torzítás veszélye, mint a súlyozott reprezentatív minta használatánál. Ezért kulcsfontosságú annak az adattömegnek a minősége, amit az MI tanítására felhasználnak.

Ahhoz, hogy az arcfelismerés a kívánt módon teljesüljön, olyan adatkészlettel kell tanítani az MI-t, ami kellően nagy, és kellően sokrétű, azaz tükrözze a világban megjelenő arcok sokféleségét. Az MI ugyanis csak így képes megtanulni azt, hogy az arcok sokféleképpen lehetnek mások – írják az adatbázis oldalán.

A tanításnál kell megfogni a problémát

Az adatbázis kb. egymillió képet tartalmaz emberi arcokról. A képeket a kutatási célokra létrehozott és az AWS-en elérhető Yahoo Flickr Creative Commons 100M (YFCC100M) adatbázisából nyerték ki egy olyan mesterséges intelligencia segítségével, amely végigment az adatbázisban található mintegy 100 millió fotón, és elkülönítette az arcokat. A továbbiakban ugyanis már csak az arcokról készült fotókat használták fel.

Az adatkészlet összeállításához meghatároztak olyan kraniofaciális (koponyára és arcra vonatkozó formai) jellemzőket, mint például a fejhossz, az orrhossz, a homlokmagasság vagy az arc szimmetriajellemzői, melyek alapján objektív tipológiát lehet készíteni. Ezt egészítették ki olyan információkkal, mint az életkor vagy a nem. (Az adatbázis létrehozását megelőző kutatási programnak van egy vékonyka magyar szála: felhasználták a modern kraniofaciális antropometria úttörőjének, a felvidéki Rózsahegyen (ma Ružomberok) 1915-ben született Leslie G. Farkasnak az eredményeit is, aki az arc- és koponyasebészeti beavatkozások tökéletesítéséhez kezdett el foglalkozni a témával.)

A DiF metaadataihoz mindent mérnek, ami mérhető

A DiF-be került egymillió kép mindegyikéhez tartozik egy metaadatkészlet, egy "faceprint", amely pontosan leírja a fejre vonatkozó jellemzőket. Emellett – és ez a DiF igazi újdonsága – a metaadatok közé bekerül, hogy a mérhető tulajdonságok hogyan kapcsolódnak egymáshoz. Megadják a mért jellemzők egymástól való távolságát, vagy a szem fölötti és az orr alatti terület arányát, pontos információkat tartalmaz a bőr színéről, az árnyalatokról stb. Még nemi szempontból is a korrektségre törekedtek: míg korábban lényegében binárisan határozták meg a nemet (valaki vagy nő, vagy férfi), most kidolgoztak egy metrikát, amely egy skálán határozza meg a nőies és férfias jellemzőket.

A szubjektivitást nem sikerült kizárni

A fejlesztők a szubjektív értékelést nem tudták teljesen kizárni. A nőies és férfias jellemzők értékelését és az életkor meghatározását is emberek végezték, ami természetesen ismét visszahozhatja az előítéletek és az azokból eredő torzítások problémáját. Ezt a program vezetője, John R. Smith is elismerte a TechCrunch-nak. Smith szerint azonban a skálás értékelés révén sokkal finomabban lehet kategorizálni, mint például ha csak azt határoznák meg, hogy az adott fotó egy nőről vagy egy férfiról készült.

A kutató másik érve az volt, hogy a DiF jelenlegi állapota közel sem a végleges, hiszen még egymillió fotóval sem garantálható, hogy az adatkészlet valóban reprezentatív az általános felhasználáshoz, és hogy kiszűrje az előítéletesség lehetőségét. Smith szerint a továbblépést az segítheti, ha az egyelőre kizárólag kutatási célokra használható adatbázis körül. A közös tudással lehet majd lépésről lépésre finomítani az adatokat.

A kutatási terület azonban nagyon fontos, hiszen már ma is számos területen használnak élesben arcfelismerő algoritmusokat. Alkalmazzák például biometrikus azonosításhoz telefonon, intelligens ajtózáraknál, sőt Kínában már azt is kutatják, hogy az arc jellemzőiből hogyan azonosítható a bűnözésre való hajlam. De hogy valami valóban jó célt is mondjunk, egy előítéletektől mentes algoritmus még a ritka betegségek arcról történő azonosításában is sokat segíthet.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hamarosan robotaxik tudhatják le az Uber-fuvarokat

A fuvarozó cég a tervek szerint az elektromos autókat gyártó Lucid és az önvezető rendszereket fejlesztő Nuro segítségével érné el azt, aminek önálló megvalósításáról még 2020-ban tett le.

A hónap témája

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.

CIO Podcast

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hamarosan robotaxik tudhatják le az Uber-fuvarokat

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2025 konferencia