A legnagyobb internetes cégek hatalmas elánnal fejlesztik a képek feldolgozására képes algoritmusokat. A Facebook kísérleti megoldása például már maszkban is felismer egy embert.

A képek mesterséges feldolgozása, elemzése számos területen nyithat új fejezetet. Nem véletlen, hogy a legnagyobb internetes cégek mind könyékig benne vannak a témában. A technológiai fejlődés ma már ott tart, hogy akár két nagyon hasonló kinézetű kutyafajtát is könnyedén megkülönböztet egymástól a gépi kód, és alapvetően már kisebb hibaszázalékkal szelektálja témák szerint a fotókat a számítógép, mint egy ember. A legjelentősebb előrelépés viszont egy hozzánk szorosan kötődő területen, az arcfelismerésnél érhető tetten.

Mélyen az arcunkban

A Facebook például a DeepFace elnevezésű projektje keretében ért el komoly áttörést az utóbbi időben. Az algoritmus a hírek szerint 97 százalékos biztonsággal megmondja, hogy két különböző fotón ugyanaz a személy látható-e. A miheztartás végett: ez jobb eredmény, mint amire az FBI által használt Next Generation Identiciation rendszer képes.

A közösségi hálózat programja simán kiszűri a különböző szögekből, időjárási viszonyokból adódó különbségeket, köszönhetően annak, hogy több mint 120 millió (!) paraméter alapján dönt. A DeepFace-t a világ legnagyobb arcokból álló adatbázisán tesztelik. Utóbbi több mint 4 millió arcképből áll, összesen mintegy 4000 emberről.

Ami igazán érdekes, hogy a jelenlegi fejlesztési fázisban már akkor is kiváló eredményeket ér el a gép, ha a "célszemély" arca szinte alig vagy egyáltalán nem látszik. Például azért, mert egy maszkot visel, vagy a kamerának háttal áll. Az elemzőprogram ugyanis immár nem csak az arc különböző pontjainak távolságából tájékozódik, hanem hajviselet, testalkat, testtartás, sőt ruházat alapján is keresi az egyezéseket. Ez a módszer jelenleg 83 százalékos pontosságnál jár, és ez csak javulni fog.

A Google is mer nagyot álmodni

Egy hónappal ezelőtt, a cég fejlesztői konferenciáján jelentette be a Google a fotógalériákhoz kapcsolódó új szolgáltatásait. Bár sokak fülét a korlátlan tárhely ütötte meg, az izgalmasabb terület egyértelműen az automatikus képkategorizálás és intelligens keresés kiteljesedése volt. 

A keresőóriás rendszere kategóriákra (emberek, helyek, dolgok), majd alkategóriákra bontja a kollekciót, ami már önmagában is különleges, mivel az applikáció mindezt automatikusan teszi. A dolog ott válik riasztóan érdekessé, amikor keresni kezdünk a saját portfóliónkban. Az ízletes kifejezésre ételfotókat, a szelfire pedig valóban szelfiket gyűjt egybe nekünk az algoritmus.

A személyek automatikus felismerése is figyelemre méltó mutatvány. Fotóink között az emberek részre kattintva például szép sorrendben kapjuk a rokonokat, barátokat, ismerősöket tartalmazó külön csomagokat, azokat előbbre rangsorolva, akikről több felvételünk van. Ez az algoritmus is elég jó eséllyel képes felismerni a személyt, még akkor is, ha szinte alig látszik valami az arcából.

Önkontroll

Érdekes módon a Google az arcfelismerésnél nem használja ki a máshol meglévő információkban rejlő lehetőségeket. Azaz hiba nélkül felismeri, hogy mondjuk a házastársunk melyik képünkön szerepel, de nem köti hozzá annak Google-fiókját. Pedig nyilvánvalóan technikailag képes lenne rá a rendszer.

Szintén érdemes megemlíteni a Facebookot, amelyik annyira tart a képfelismerésre adott esetleges negatív felhasználói rekcióktól, hogy a fejlesztés során kifejezetten tartózkodnak attól, hogy a közösségi oldal, egyébként páratlan adatbázisát használják. Mondjuk érthető is az óvatosság, hiszen például a fotók tagelésénél korábban is használt automatikus javaslatok rendszerét három éve vissza kellett vonni az európai adatvédelmi aggályok miatt.

Riasztó és izgalmas

A képfelismerési technológia ilyen elképesztő fejlődése természetszerűleg ellenérzéseket vált ki a privát szférájuk miatt aggódó felhasználókból. Hogy egy meglehetősen köznapi példát hozzunk, a tudományos-fantasztikus filmekben látott személyre szabott reklámok világa alig egy fél lépésre van innen. A megfigyelési botrányok korában az sem feltétlenül tölt el boldogsággal mindenkit, hogy bárhol jár, simán követhetővé válik. Még akkor is, ha folytonosan információt küldözgető mobilját gondosan otthon hagyja.

Az éremnek persze van egy másik oldala. A technológiával nem feltétlenül kell visszaélni, és bőségesen van olyan felhasználási terület, ami a köz javát szolgálja. Mondjuk a fenti elemző algoritmusok segítségével igen könnyen be lehet azonosítani egy símaszkban bankrablást elkövető tettes személyazonosságát. De könnyebben a nyomára lehetne bukkanni egy eltűnt, esetleg elrabolt embernek is, ha az ipari, térfigyelő kamerák felvételeit ezek az automatikus rendszerek fésülnék át.

Cloud & big data

A sötét webet figyelik a Google MI-ügynökei

A Google Threat Intelligence rendszerében a Gemini-alapú ágensek önjáróan elemezgetik a dark webes fórumokat, hogy az eddigieknél hatékonyabban tárják fel az adatszivárgásokat és a kezdeti hozzáféréseket.
 
Nincs egy új, "alapértelmezett" platform a VMware mellett, helyett; az informatikai vezetők egy, a korábbinál jelentősen összetettebb döntési helyzetben találják magukat 2026-ban. Cikkünk arra a kérdésre keresi a választ, hogy milyen lehetőségek közül választhatnak a CIO-k.

a melléklet támogatója az EURO ONE

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.