Rémisztően jók az arcfelismerő algoritmusok

Bitport2015.06.29.Cloud & big data

A legnagyobb internetes cégek hatalmas elánnal fejlesztik a képek feldolgozására képes algoritmusokat. A Facebook kísérleti megoldása például már maszkban is felismer egy embert.

A képek mesterséges feldolgozása, elemzése számos területen nyithat új fejezetet. Nem véletlen, hogy a legnagyobb internetes cégek mind könyékig benne vannak a témában. A technológiai fejlődés ma már ott tart, hogy akár két nagyon hasonló kinézetű kutyafajtát is könnyedén megkülönböztet egymástól a gépi kód, és alapvetően már kisebb hibaszázalékkal szelektálja témák szerint a fotókat a számítógép, mint egy ember. A legjelentősebb előrelépés viszont egy hozzánk szorosan kötődő területen, az arcfelismerésnél érhető tetten.

Mélyen az arcunkban

A Facebook például a DeepFace elnevezésű projektje keretében ért el komoly áttörést az utóbbi időben. Az algoritmus a hírek szerint 97 százalékos biztonsággal megmondja, hogy két különböző fotón ugyanaz a személy látható-e. A miheztartás végett: ez jobb eredmény, mint amire az FBI által használt Next Generation Identiciation rendszer képes.

A közösségi hálózat programja simán kiszűri a különböző szögekből, időjárási viszonyokból adódó különbségeket, köszönhetően annak, hogy több mint 120 millió (!) paraméter alapján dönt. A DeepFace-t a világ legnagyobb arcokból álló adatbázisán tesztelik. Utóbbi több mint 4 millió arcképből áll, összesen mintegy 4000 emberről.

Ami igazán érdekes, hogy a jelenlegi fejlesztési fázisban már akkor is kiváló eredményeket ér el a gép, ha a "célszemély" arca szinte alig vagy egyáltalán nem látszik. Például azért, mert egy maszkot visel, vagy a kamerának háttal áll. Az elemzőprogram ugyanis immár nem csak az arc különböző pontjainak távolságából tájékozódik, hanem hajviselet, testalkat, testtartás, sőt ruházat alapján is keresi az egyezéseket. Ez a módszer jelenleg 83 százalékos pontosságnál jár, és ez csak javulni fog.

A Google is mer nagyot álmodni

Egy hónappal ezelőtt, a cég fejlesztői konferenciáján jelentette be a Google a fotógalériákhoz kapcsolódó új szolgáltatásait. Bár sokak fülét a korlátlan tárhely ütötte meg, az izgalmasabb terület egyértelműen az automatikus képkategorizálás és intelligens keresés kiteljesedése volt.

A keresőóriás rendszere kategóriákra (emberek, helyek, dolgok), majd alkategóriákra bontja a kollekciót, ami már önmagában is különleges, mivel az applikáció mindezt automatikusan teszi. A dolog ott válik riasztóan érdekessé, amikor keresni kezdünk a saját portfóliónkban. Az ízletes kifejezésre ételfotókat, a szelfire pedig valóban szelfiket gyűjt egybe nekünk az algoritmus.

A személyek automatikus felismerése is figyelemre méltó mutatvány. Fotóink között az emberek részre kattintva például szép sorrendben kapjuk a rokonokat, barátokat, ismerősöket tartalmazó külön csomagokat, azokat előbbre rangsorolva, akikről több felvételünk van. Ez az algoritmus is elég jó eséllyel képes felismerni a személyt, még akkor is, ha szinte alig látszik valami az arcából.

Önkontroll

Érdekes módon a Google az arcfelismerésnél nem használja ki a máshol meglévő információkban rejlő lehetőségeket. Azaz hiba nélkül felismeri, hogy mondjuk a házastársunk melyik képünkön szerepel, de nem köti hozzá annak Google-fiókját. Pedig nyilvánvalóan technikailag képes lenne rá a rendszer.

Szintén érdemes megemlíteni a Facebookot, amelyik annyira tart a képfelismerésre adott esetleges negatív felhasználói rekcióktól, hogy a fejlesztés során kifejezetten tartózkodnak attól, hogy a közösségi oldal, egyébként páratlan adatbázisát használják. Mondjuk érthető is az óvatosság, hiszen például a fotók tagelésénél korábban is használt automatikus javaslatok rendszerét három éve vissza kellett vonni az európai adatvédelmi aggályok miatt.

Riasztó és izgalmas

A képfelismerési technológia ilyen elképesztő fejlődése természetszerűleg ellenérzéseket vált ki a privát szférájuk miatt aggódó felhasználókból. Hogy egy meglehetősen köznapi példát hozzunk, a tudományos-fantasztikus filmekben látott személyre szabott reklámok világa alig egy fél lépésre van innen. A megfigyelési botrányok korában az sem feltétlenül tölt el boldogsággal mindenkit, hogy bárhol jár, simán követhetővé válik. Még akkor is, ha folytonosan információt küldözgető mobilját gondosan otthon hagyja.

Az éremnek persze van egy másik oldala. A technológiával nem feltétlenül kell visszaélni, és bőségesen van olyan felhasználási terület, ami a köz javát szolgálja. Mondjuk a fenti elemző algoritmusok segítségével igen könnyen be lehet azonosítani egy símaszkban bankrablást elkövető tettes személyazonosságát. De könnyebben a nyomára lehetne bukkanni egy eltűnt, esetleg elrabolt embernek is, ha az ipari, térfigyelő kamerák felvételeit ezek az automatikus rendszerek fésülnék át.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

A KPMG megíratta az MI-vel, hogy mi mindenre jó az MI – csak hibásan

Az mindenesetre kiderült, hogy a mesterséges intelligencia önfényezésben legalább annyira jó, mint a tanácsadók.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

A KPMG megíratta az MI-vel, hogy mi mindenre jó az MI – csak hibásan

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!