A legnagyobb internetes cégek hatalmas elánnal fejlesztik a képek feldolgozására képes algoritmusokat. A Facebook kísérleti megoldása például már maszkban is felismer egy embert.

A képek mesterséges feldolgozása, elemzése számos területen nyithat új fejezetet. Nem véletlen, hogy a legnagyobb internetes cégek mind könyékig benne vannak a témában. A technológiai fejlődés ma már ott tart, hogy akár két nagyon hasonló kinézetű kutyafajtát is könnyedén megkülönböztet egymástól a gépi kód, és alapvetően már kisebb hibaszázalékkal szelektálja témák szerint a fotókat a számítógép, mint egy ember. A legjelentősebb előrelépés viszont egy hozzánk szorosan kötődő területen, az arcfelismerésnél érhető tetten.

Mélyen az arcunkban

A Facebook például a DeepFace elnevezésű projektje keretében ért el komoly áttörést az utóbbi időben. Az algoritmus a hírek szerint 97 százalékos biztonsággal megmondja, hogy két különböző fotón ugyanaz a személy látható-e. A miheztartás végett: ez jobb eredmény, mint amire az FBI által használt Next Generation Identiciation rendszer képes.

A közösségi hálózat programja simán kiszűri a különböző szögekből, időjárási viszonyokból adódó különbségeket, köszönhetően annak, hogy több mint 120 millió (!) paraméter alapján dönt. A DeepFace-t a világ legnagyobb arcokból álló adatbázisán tesztelik. Utóbbi több mint 4 millió arcképből áll, összesen mintegy 4000 emberről.

Ami igazán érdekes, hogy a jelenlegi fejlesztési fázisban már akkor is kiváló eredményeket ér el a gép, ha a "célszemély" arca szinte alig vagy egyáltalán nem látszik. Például azért, mert egy maszkot visel, vagy a kamerának háttal áll. Az elemzőprogram ugyanis immár nem csak az arc különböző pontjainak távolságából tájékozódik, hanem hajviselet, testalkat, testtartás, sőt ruházat alapján is keresi az egyezéseket. Ez a módszer jelenleg 83 százalékos pontosságnál jár, és ez csak javulni fog.

A Google is mer nagyot álmodni

Egy hónappal ezelőtt, a cég fejlesztői konferenciáján jelentette be a Google a fotógalériákhoz kapcsolódó új szolgáltatásait. Bár sokak fülét a korlátlan tárhely ütötte meg, az izgalmasabb terület egyértelműen az automatikus képkategorizálás és intelligens keresés kiteljesedése volt. 

A keresőóriás rendszere kategóriákra (emberek, helyek, dolgok), majd alkategóriákra bontja a kollekciót, ami már önmagában is különleges, mivel az applikáció mindezt automatikusan teszi. A dolog ott válik riasztóan érdekessé, amikor keresni kezdünk a saját portfóliónkban. Az ízletes kifejezésre ételfotókat, a szelfire pedig valóban szelfiket gyűjt egybe nekünk az algoritmus.

A személyek automatikus felismerése is figyelemre méltó mutatvány. Fotóink között az emberek részre kattintva például szép sorrendben kapjuk a rokonokat, barátokat, ismerősöket tartalmazó külön csomagokat, azokat előbbre rangsorolva, akikről több felvételünk van. Ez az algoritmus is elég jó eséllyel képes felismerni a személyt, még akkor is, ha szinte alig látszik valami az arcából.

Önkontroll

Érdekes módon a Google az arcfelismerésnél nem használja ki a máshol meglévő információkban rejlő lehetőségeket. Azaz hiba nélkül felismeri, hogy mondjuk a házastársunk melyik képünkön szerepel, de nem köti hozzá annak Google-fiókját. Pedig nyilvánvalóan technikailag képes lenne rá a rendszer.

Szintén érdemes megemlíteni a Facebookot, amelyik annyira tart a képfelismerésre adott esetleges negatív felhasználói rekcióktól, hogy a fejlesztés során kifejezetten tartózkodnak attól, hogy a közösségi oldal, egyébként páratlan adatbázisát használják. Mondjuk érthető is az óvatosság, hiszen például a fotók tagelésénél korábban is használt automatikus javaslatok rendszerét három éve vissza kellett vonni az európai adatvédelmi aggályok miatt.

Riasztó és izgalmas

A képfelismerési technológia ilyen elképesztő fejlődése természetszerűleg ellenérzéseket vált ki a privát szférájuk miatt aggódó felhasználókból. Hogy egy meglehetősen köznapi példát hozzunk, a tudományos-fantasztikus filmekben látott személyre szabott reklámok világa alig egy fél lépésre van innen. A megfigyelési botrányok korában az sem feltétlenül tölt el boldogsággal mindenkit, hogy bárhol jár, simán követhetővé válik. Még akkor is, ha folytonosan információt küldözgető mobilját gondosan otthon hagyja.

Az éremnek persze van egy másik oldala. A technológiával nem feltétlenül kell visszaélni, és bőségesen van olyan felhasználási terület, ami a köz javát szolgálja. Mondjuk a fenti elemző algoritmusok segítségével igen könnyen be lehet azonosítani egy símaszkban bankrablást elkövető tettes személyazonosságát. De könnyebben a nyomára lehetne bukkanni egy eltűnt, esetleg elrabolt embernek is, ha az ipari, térfigyelő kamerák felvételeit ezek az automatikus rendszerek fésülnék át.

Cloud & big data

42. Körkapcsolás: Mi és az MI

Mekkora teret hagy a projektmenedzsereknek a mesterséges intelligencia? Többek között erre az aktuális kérdésre keresték a választ a PMSZ rendezvényén.
 
Ezt már akkor sokan állították, amikor a Watson vagy a DeepMind még legfeljebb érdekes játék volt, mert jó volt kvízben, sakkban vagy góban.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.