Meghökkentő, vicces és egyben lenyűgöző alkotásokat produkált a Google képfelismerésre tanított algoritmusa, amikor a kutatók megfordították a feladatot.

Számos más kezdeményezés mellett természetesen a Google kutatóit is foglalkoztatja a gépek képfelismerési képességének fejlesztése. A cég fejlesztői blogján most egy érdekes bejegyzést tettek közzé, amely bepillantást enged a kulisszák mögé.

Mesterséges idegpályák

A keresőóriás kutatócsapata egy olyan algortimuson dolgozik, amely mesterséges ideghálózat segítségével igyekszik az emberi képfelismerést szimulálni. A mesterséges intelligencia rétegekből áll, ahol az egyes szintek más és más típusú ismertető jegyek után kutatnak, majd a kapott eredményt továbbítják a felsőbb, egyre bonyolultabb, elvontabb fogalmakkal is megbírkózni képes rétegek felé. Míg az alacsonyabb szinteken csak az alakzat éleit, sarkait igyekszik beazonosítani a program, addig a fejlettebb rétegek már alapvető formákat keresnek (például egy ajtóét vagy levélét), a legutolsó egységek pedig már olyan komplex alakzatokat képesek azonosítani, mint egy épület vagy egy fa.

A kutatók számára azonban nem triviális, hogy az egyes szinteken pontosan mi is zajlik és hogy jut arra a kimenetre a gép, amit végül továbbít a sorban következő szintnek. Ennek megértésére találták ki a feje tetejére állított módszert. Azaz nem egy ismeretlen képet mutatnak a gépi intelligenciának, amiről meg kell állapítania, hogy mit ábrázol, hanem arra utasítják, hogy alakítson át egyet úgy, hogy az egy korábban képek ezreivel "begyakoroltatot" tárgyat vagy élőlényt formázzon.
 


 

A fenti képeket egy teljesen értelmezhetetlen, véletlenszerű színes ponthalmazból (vizuális zajból) generálta a mesterséges intelligencia. Minden képnél az volt a feladata, hogy egy bizonyos formát igyekezzen megtalálni, majd felerősítenie az alapképen. A számítógép tehát megkereste például azokat a területeket, amelyek egy banánra hasonlítottak, majd kicsit felnagyította ezeket a halvány hasonlóságokat. A következő körben aztán még inkább be tudta határolni a banánok helyét, újra erősített rajtuk, és így tovább, egészen a kész "műalkotásokig".
 


 

Hogy miért fontos ez a visszafelé ellenőrzés, arra konkrét példát is kaptak a kutatók. A fenti képsorozatnál ugyanis súlyzót kellett alkotnia a gépnek. Mint látható, ez nagyjából sikerült is, ám a súlyzókhoz szinte minden esetben egy azokat mozgató emberi kart is odaképzelt a mesterséges intelligencia. Ebből kiderült, hogy a tanítási szakasz nem volt tökéletes, a gép nem tudta elválasztani egymástól a súlyzó és az azt tartó kéz fogalmát.

Pszichedelikus álmok

Még érdekesebb eredményt kaptak a szakemberek akkor, amikor a gépi intelligenciának nem mondták meg, mit is kellene belelátnia egy ábrába. Csak fogtak egy képet, és engedték, hogy szabadon asszociálva erősítse fel azokat a formákat, amelyeket felismerni vél. A történetet még azzal is megfűszerezték, hogy ezt a feladatot kifejezetten egy mesterséges idegi szintnek adták ki. Mivel ahogy már korábban írtuk, ezek a szintek teljesen más típusú és komplexitású mintázatokat keresnek, az átalakítás is eltérő eredményeket hozott.
 

A kép kattintásra nagyítható


A magasabb szintű felismerő rétegek nem egyszer elképesztően érdekes képeket gyártottak. Egyikről-másikról simán el lehetne hinni, hogy egy pszichedelikus stílusú művész alkotása, és nem egy álmodozó algoritmusé. Azok a rendszerek, amelyeket például állatok képével tanítottak a formák felismerésére, mindenhová be tudták csempészni a nekik "kedves" madarakat, kutyákat. Így lett a nyitóképen látható híres Edvard Munch festmény sikoltó embere is kutyafejű. De hasonló bravúrokat mutattak be azok a gépi tanulók is, amelyeket épületek, városok képeivel kondicionáltak.
 


 


 


Aki a gépi művészet további kortárs remekeiben akar gyönyörködni, látogasson el a kutatói képgalériára

Cloud & big data

Több mint félszázezer műholddal sűrítené az égboltot Bezos cége

A Blue Origin amerikai hatóságokhoz beadott kérelme szerint akár 51 600 szatellitből is állhat a vállalt tervezett adatközpontos űrflottája.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.