Az IBM olyan arcgyűjteményt készített, amely segít a mesterséges intelligencia torzításainak csökkentésében. Egyelőre kutatási célra szánják.

Bárhol is alkalmaztak eddig mesterségesintelligencia-algoritmusokat az emberek megfigyelésére és azonosítására, szinte minden alkalommal az derült ki, hogy az algoritmusok is előítéletesen döntenek. Az IBM most olyan oktató adatbázist készített arcfelismerő mesterséges intelligenciáknak (MI), amely píszívé nevelné a különböző megoldásokat. Ez újabb fontos lépés a tavaly ősszel bemutatott előítélet-detektáló, az AI Fairness 360 felhős szolgáltatás után. A most elérhetővé tett Diversity in Faces (DiF) adatbázis célja, hogy kellően sokszínű mintát biztosítson, melyekkel pontosabban működő adatmodellek készíthetők.

Mint a vállalat közleménye írja, az MI annál pontosabb modellt tud készíteni, minél több adatot tud feldolgozni az adatvezérelt mélytanulás során. Ám ennek során jelentkezik az a probléma, ami a bigdata-elemzéseknek is az egyik rákfenéje: nagyobb a torzítás veszélye, mint a súlyozott reprezentatív minta használatánál. Ezért kulcsfontosságú annak az adattömegnek a minősége, amit az MI tanítására felhasználnak.

Ahhoz, hogy az arcfelismerés a kívánt módon teljesüljön, olyan adatkészlettel kell tanítani az MI-t, ami kellően nagy, és kellően sokrétű, azaz tükrözze a világban megjelenő arcok sokféleségét. Az MI ugyanis csak így képes megtanulni azt, hogy az arcok sokféleképpen lehetnek mások – írják az adatbázis oldalán.

A tanításnál kell megfogni a problémát

Az adatbázis kb. egymillió képet tartalmaz emberi arcokról. A képeket a kutatási célokra létrehozott és az AWS-en elérhető Yahoo Flickr Creative Commons 100M (YFCC100M) adatbázisából nyerték ki egy olyan mesterséges intelligencia segítségével, amely végigment az adatbázisban található mintegy 100 millió fotón, és elkülönítette az arcokat. A továbbiakban ugyanis már csak az arcokról készült fotókat használták fel.

Az adatkészlet összeállításához meghatároztak olyan kraniofaciális (koponyára és arcra vonatkozó formai) jellemzőket, mint például a fejhossz, az orrhossz, a homlokmagasság vagy az arc szimmetriajellemzői, melyek alapján objektív tipológiát lehet készíteni. Ezt egészítették ki olyan információkkal, mint az életkor vagy a nem. (Az adatbázis létrehozását megelőző kutatási programnak van egy vékonyka magyar szála: felhasználták a modern kraniofaciális antropometria úttörőjének, a felvidéki Rózsahegyen (ma Ružomberok) 1915-ben született Leslie G. Farkasnak az eredményeit is, aki az arc- és koponyasebészeti beavatkozások tökéletesítéséhez kezdett el foglalkozni a témával.)
 

A DiF metaadataihoz mindent mérnek, ami mérhető


A DiF-be került egymillió kép mindegyikéhez tartozik egy metaadatkészlet, egy "faceprint", amely pontosan leírja a fejre vonatkozó jellemzőket. Emellett – és ez a DiF igazi újdonsága – a metaadatok közé bekerül, hogy a mérhető tulajdonságok hogyan kapcsolódnak egymáshoz. Megadják a mért jellemzők egymástól való távolságát, vagy a szem fölötti és az orr alatti terület arányát, pontos információkat tartalmaz a bőr színéről, az árnyalatokról stb. Még nemi szempontból is a korrektségre törekedtek: míg korábban lényegében binárisan határozták meg a nemet (valaki vagy nő, vagy férfi), most kidolgoztak egy metrikát, amely egy skálán határozza meg a nőies és férfias jellemzőket.

A szubjektivitást nem sikerült kizárni

A fejlesztők a szubjektív értékelést nem tudták teljesen kizárni. A nőies és férfias jellemzők értékelését és az életkor meghatározását is emberek végezték, ami természetesen ismét visszahozhatja az előítéletek és az azokból eredő torzítások problémáját. Ezt a program vezetője, John R. Smith is elismerte a TechCrunch-nak. Smith szerint azonban a skálás értékelés révén sokkal finomabban lehet kategorizálni, mint például ha csak azt határoznák meg, hogy az adott fotó egy nőről vagy egy férfiról készült.

A kutató másik érve az volt, hogy a DiF jelenlegi állapota közel sem a végleges, hiszen még egymillió fotóval sem garantálható, hogy az adatkészlet valóban reprezentatív az általános felhasználáshoz, és hogy kiszűrje az előítéletesség lehetőségét. Smith szerint a továbblépést az segítheti, ha az egyelőre kizárólag kutatási célokra használható adatbázis körül. A közös tudással lehet majd lépésről lépésre finomítani az adatokat.

A kutatási terület azonban nagyon fontos, hiszen már ma is számos területen használnak élesben arcfelismerő algoritmusokat. Alkalmazzák például biometrikus azonosításhoz telefonon, intelligens ajtózáraknál, sőt Kínában már azt is kutatják, hogy az arc jellemzőiből hogyan azonosítható a bűnözésre való hajlam. De hogy valami valóban jó célt is mondjunk, egy előítéletektől mentes algoritmus még a ritka betegségek arcról történő azonosításában is sokat segíthet.

Cloud & big data

Tesz a politikára az X

Egy félmilliárdos közösségi platform esetében aggasztó, ha nem erősíti, hanem éppen ellenkezőleg, gyengíti a politikai tartalmú álhírek elleni védőhálót. Az EU fenyeget, a népszavazásra készülő ausztrálok aggódnak.
 
A világ a "cloud first" stratégiát követi. Nem kérdés, hogy a IT-biztonságnak is azzal kell tartania a tempót, de nem felejtheti, hogy honnan startolt.

a melléklet támogatója a Clico Hungary

Hirdetés

Jön a Clico formabontó cloud meetupja, ahol eloszlatják a viharfelhőket

Merre mennek a bitek a felhőben, ledobja-e szemellenzőjét az IT-biztonságért felelős kolléga, ha felhőt lát, lesz-e két év múlva fejlesztés cloud nélkül? A Clico novemberben fesztelen szakmázásra hívja a szoftverfejlesztőket a müncheni sörkertek vibrálását idéző KEG sörművházba.

Minden vállalatnak számolnia kell az életciklusuk végéhez érő technológiák licencelési keresztkockázataival. Rogányi Dániel és Vincze-Berecz Tibor (IPR-Insights) írása.

Miért ne becsüljük le a kisbetűs jelszavakat? 1. rész

Miért ne becsüljük le a kisbetűs jelszavakat? 2. rész

Miért ne becsüljük le a kisbetűs jelszavakat? 3. rész

A felmérésekből egyre inkább kiderül, hogy az alkalmazottak megtartása vagy távozása sokszor azon múlik, amit a szervezetük nem csinál, nem pedig azon, amiben egymásra licitál a többi munkáltatóval.

Ezért fontos számszerűsíteni a biztonsági kockázatokat

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2023 Bitport.hu Média Kft. Minden jog fenntartva.