Meghökkentő, vicces és egyben lenyűgöző alkotásokat produkált a Google képfelismerésre tanított algoritmusa, amikor a kutatók megfordították a feladatot.

Számos más kezdeményezés mellett természetesen a Google kutatóit is foglalkoztatja a gépek képfelismerési képességének fejlesztése. A cég fejlesztői blogján most egy érdekes bejegyzést tettek közzé, amely bepillantást enged a kulisszák mögé.

Mesterséges idegpályák

A keresőóriás kutatócsapata egy olyan algortimuson dolgozik, amely mesterséges ideghálózat segítségével igyekszik az emberi képfelismerést szimulálni. A mesterséges intelligencia rétegekből áll, ahol az egyes szintek más és más típusú ismertető jegyek után kutatnak, majd a kapott eredményt továbbítják a felsőbb, egyre bonyolultabb, elvontabb fogalmakkal is megbírkózni képes rétegek felé. Míg az alacsonyabb szinteken csak az alakzat éleit, sarkait igyekszik beazonosítani a program, addig a fejlettebb rétegek már alapvető formákat keresnek (például egy ajtóét vagy levélét), a legutolsó egységek pedig már olyan komplex alakzatokat képesek azonosítani, mint egy épület vagy egy fa.

A kutatók számára azonban nem triviális, hogy az egyes szinteken pontosan mi is zajlik és hogy jut arra a kimenetre a gép, amit végül továbbít a sorban következő szintnek. Ennek megértésére találták ki a feje tetejére állított módszert. Azaz nem egy ismeretlen képet mutatnak a gépi intelligenciának, amiről meg kell állapítania, hogy mit ábrázol, hanem arra utasítják, hogy alakítson át egyet úgy, hogy az egy korábban képek ezreivel "begyakoroltatot" tárgyat vagy élőlényt formázzon.
 


 

A fenti képeket egy teljesen értelmezhetetlen, véletlenszerű színes ponthalmazból (vizuális zajból) generálta a mesterséges intelligencia. Minden képnél az volt a feladata, hogy egy bizonyos formát igyekezzen megtalálni, majd felerősítenie az alapképen. A számítógép tehát megkereste például azokat a területeket, amelyek egy banánra hasonlítottak, majd kicsit felnagyította ezeket a halvány hasonlóságokat. A következő körben aztán még inkább be tudta határolni a banánok helyét, újra erősített rajtuk, és így tovább, egészen a kész "műalkotásokig".
 


 

Hogy miért fontos ez a visszafelé ellenőrzés, arra konkrét példát is kaptak a kutatók. A fenti képsorozatnál ugyanis súlyzót kellett alkotnia a gépnek. Mint látható, ez nagyjából sikerült is, ám a súlyzókhoz szinte minden esetben egy azokat mozgató emberi kart is odaképzelt a mesterséges intelligencia. Ebből kiderült, hogy a tanítási szakasz nem volt tökéletes, a gép nem tudta elválasztani egymástól a súlyzó és az azt tartó kéz fogalmát.

Pszichedelikus álmok

Még érdekesebb eredményt kaptak a szakemberek akkor, amikor a gépi intelligenciának nem mondták meg, mit is kellene belelátnia egy ábrába. Csak fogtak egy képet, és engedték, hogy szabadon asszociálva erősítse fel azokat a formákat, amelyeket felismerni vél. A történetet még azzal is megfűszerezték, hogy ezt a feladatot kifejezetten egy mesterséges idegi szintnek adták ki. Mivel ahogy már korábban írtuk, ezek a szintek teljesen más típusú és komplexitású mintázatokat keresnek, az átalakítás is eltérő eredményeket hozott.
 

A kép kattintásra nagyítható


A magasabb szintű felismerő rétegek nem egyszer elképesztően érdekes képeket gyártottak. Egyikről-másikról simán el lehetne hinni, hogy egy pszichedelikus stílusú művész alkotása, és nem egy álmodozó algoritmusé. Azok a rendszerek, amelyeket például állatok képével tanítottak a formák felismerésére, mindenhová be tudták csempészni a nekik "kedves" madarakat, kutyákat. Így lett a nyitóképen látható híres Edvard Munch festmény sikoltó embere is kutyafejű. De hasonló bravúrokat mutattak be azok a gépi tanulók is, amelyeket épületek, városok képeivel kondicionáltak.
 


 


 


Aki a gépi művészet további kortárs remekeiben akar gyönyörködni, látogasson el a kutatói képgalériára

Cloud & big data

Milliónyi app elutasításával mosdatja magát az Apple

Cupertino részletes jelentést adott arról, mennyit dolgozott tavaly azon, hogy eszközeire ne lehessen káros alkalmazásokat telepíteni. Van azonban olyan helyzet, amikor a sok is kevés lehet.
 
...az pedig sokkal gyorsabb, ha mindent csak egyszer, vagy még egyszer sem kell személyesen elvégezni. Májusi mellékletünk második része az IT infrastruktúra automatizálásáról.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

Az elmúlt tíz évben radikális változás történt az adatfeldolgozásban, ami az infrastruktúrát is átalakította.

a melléklet támogatója a Dell Magyarország

Ha bővítené tudását és fejlődne a digitális transzformáció területén, látogasson el a Transformation-experts.hu oldalra, ahol egy gyors regisztráció után inspiráló cikkek, esettanulmányok, prezentációk, videók és egyéb szakértői anyagok széles tárházához kap hozzáférést.

A KPMG immár 22. alkalommal kiadott CIO Survey jelentése szerint idén az informatikai vezetők leginkább a digitalizációra, a biztonságra és a szoftverszolgáltatásokra koncentráltak.

Használtszoftver-kereskedelem a Brexit után

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.