Az IBM olyan arcgyűjteményt készített, amely segít a mesterséges intelligencia torzításainak csökkentésében. Egyelőre kutatási célra szánják.

Bárhol is alkalmaztak eddig mesterségesintelligencia-algoritmusokat az emberek megfigyelésére és azonosítására, szinte minden alkalommal az derült ki, hogy az algoritmusok is előítéletesen döntenek. Az IBM most olyan oktató adatbázist készített arcfelismerő mesterséges intelligenciáknak (MI), amely píszívé nevelné a különböző megoldásokat. Ez újabb fontos lépés a tavaly ősszel bemutatott előítélet-detektáló, az AI Fairness 360 felhős szolgáltatás után. A most elérhetővé tett Diversity in Faces (DiF) adatbázis célja, hogy kellően sokszínű mintát biztosítson, melyekkel pontosabban működő adatmodellek készíthetők.

Mint a vállalat közleménye írja, az MI annál pontosabb modellt tud készíteni, minél több adatot tud feldolgozni az adatvezérelt mélytanulás során. Ám ennek során jelentkezik az a probléma, ami a bigdata-elemzéseknek is az egyik rákfenéje: nagyobb a torzítás veszélye, mint a súlyozott reprezentatív minta használatánál. Ezért kulcsfontosságú annak az adattömegnek a minősége, amit az MI tanítására felhasználnak.

Ahhoz, hogy az arcfelismerés a kívánt módon teljesüljön, olyan adatkészlettel kell tanítani az MI-t, ami kellően nagy, és kellően sokrétű, azaz tükrözze a világban megjelenő arcok sokféleségét. Az MI ugyanis csak így képes megtanulni azt, hogy az arcok sokféleképpen lehetnek mások – írják az adatbázis oldalán.

A tanításnál kell megfogni a problémát

Az adatbázis kb. egymillió képet tartalmaz emberi arcokról. A képeket a kutatási célokra létrehozott és az AWS-en elérhető Yahoo Flickr Creative Commons 100M (YFCC100M) adatbázisából nyerték ki egy olyan mesterséges intelligencia segítségével, amely végigment az adatbázisban található mintegy 100 millió fotón, és elkülönítette az arcokat. A továbbiakban ugyanis már csak az arcokról készült fotókat használták fel.

Az adatkészlet összeállításához meghatároztak olyan kraniofaciális (koponyára és arcra vonatkozó formai) jellemzőket, mint például a fejhossz, az orrhossz, a homlokmagasság vagy az arc szimmetriajellemzői, melyek alapján objektív tipológiát lehet készíteni. Ezt egészítették ki olyan információkkal, mint az életkor vagy a nem. (Az adatbázis létrehozását megelőző kutatási programnak van egy vékonyka magyar szála: felhasználták a modern kraniofaciális antropometria úttörőjének, a felvidéki Rózsahegyen (ma Ružomberok) 1915-ben született Leslie G. Farkasnak az eredményeit is, aki az arc- és koponyasebészeti beavatkozások tökéletesítéséhez kezdett el foglalkozni a témával.)
 

A DiF metaadataihoz mindent mérnek, ami mérhető


A DiF-be került egymillió kép mindegyikéhez tartozik egy metaadatkészlet, egy "faceprint", amely pontosan leírja a fejre vonatkozó jellemzőket. Emellett – és ez a DiF igazi újdonsága – a metaadatok közé bekerül, hogy a mérhető tulajdonságok hogyan kapcsolódnak egymáshoz. Megadják a mért jellemzők egymástól való távolságát, vagy a szem fölötti és az orr alatti terület arányát, pontos információkat tartalmaz a bőr színéről, az árnyalatokról stb. Még nemi szempontból is a korrektségre törekedtek: míg korábban lényegében binárisan határozták meg a nemet (valaki vagy nő, vagy férfi), most kidolgoztak egy metrikát, amely egy skálán határozza meg a nőies és férfias jellemzőket.

A szubjektivitást nem sikerült kizárni

A fejlesztők a szubjektív értékelést nem tudták teljesen kizárni. A nőies és férfias jellemzők értékelését és az életkor meghatározását is emberek végezték, ami természetesen ismét visszahozhatja az előítéletek és az azokból eredő torzítások problémáját. Ezt a program vezetője, John R. Smith is elismerte a TechCrunch-nak. Smith szerint azonban a skálás értékelés révén sokkal finomabban lehet kategorizálni, mint például ha csak azt határoznák meg, hogy az adott fotó egy nőről vagy egy férfiról készült.

A kutató másik érve az volt, hogy a DiF jelenlegi állapota közel sem a végleges, hiszen még egymillió fotóval sem garantálható, hogy az adatkészlet valóban reprezentatív az általános felhasználáshoz, és hogy kiszűrje az előítéletesség lehetőségét. Smith szerint a továbblépést az segítheti, ha az egyelőre kizárólag kutatási célokra használható adatbázis körül. A közös tudással lehet majd lépésről lépésre finomítani az adatokat.

A kutatási terület azonban nagyon fontos, hiszen már ma is számos területen használnak élesben arcfelismerő algoritmusokat. Alkalmazzák például biometrikus azonosításhoz telefonon, intelligens ajtózáraknál, sőt Kínában már azt is kutatják, hogy az arc jellemzőiből hogyan azonosítható a bűnözésre való hajlam. De hogy valami valóban jó célt is mondjunk, egy előítéletektől mentes algoritmus még a ritka betegségek arcról történő azonosításában is sokat segíthet.

Cloud & big data

Itthon már szinte mindenki netezik a mobilján

Egy friss felmérés szerint jelenleg 6,2 millióra tehető a hazai felnőtt okostelefon-használók tábora, akik közül nagyjából 6 millióan szörfölnek is mobiljukon.
 
Hirdetés

Felhőben az erő

Gyorsan változó hardveres technológiák, finomodó szoftveres környezet és felkészültebb humán erőforrás teszi jövőbiztossá a felhőt.

Veszélyek garmadája bújik meg a webes alkalmazások és az alkalmazásprogramozási interfészek közötti forgalomban. Ezek kiszűrésére és hatástalanítására szerencsére egyre hatékonyabb eszközökkel rendelkezünk.

a melléklet támogatója a Balasys

A Világgazdasági Fórum figyelmeztetése szerint jelentős szakadék tátong a C-szintű vezetők és az információbiztonságért felelős részlegek helyzetértékelése között.

A járvány üzleti vezetőt csinált a CIO-kból

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.