Inkább bele sem gondolunk abba, honnan jöhetett a japán kutatóknak az az ötlete, hogy mesterséges intelligencia (MI) segítségével hozzanak létre realisztikus, de valóságban nem létező divatmodelleket. A Kiotói Egyetem kampuszán működő DataGrid nevű cég kidolgozott egy olyan mélytanuláson alapuló MI algoritmust (japánul tudók itt informálódhatnak), amely fotorealisztikus emberek képét tudja létrehozni, sőt a modelleket valósághűen meg is tudja mozdítani – természetesen csak a virtuális térben.
Létező technológiát tökéletesítettek
A legjobb az egészben, hogy a folyamat szinte teljesen automatikus. A japánok egyébként nem találtak kis semmi újat. Ők is az ún Generative Adversarial Network (GAN) technológiát használták, amely algoritmus eredendően egy általános eszköz valósághű objektumok létrehozására. Az, hogy ez az objektum egy emberek utánzata vagy valami más, a fejlesztés szempontjából mindegy, bár az kétségtelen, hogy fotorealisztikus vasgolyót – a formát és a textrúrát – lényegesen egyszerűbb létrehozni, mint egy embert. A technológia a videojáték-fejlesztők körében is egyre elterjedtebb.
De azért a DataGrid beletett saját mélytanulási algoritmusába néhány innovatív újítást. Mindenekelőtt az eddig főleg arcok generálására használt technológiát kiterjesztette a teljes emberi testre, valamint a mozgásra. Emellett sikerült megoldaniuk azt is, hogy az arcok ne legyenek túl szabályosak (szigorú szimmetria, szabályos fogazat, bőrszín egyneműsége stb.), hanem ahogy a való életben, minden modellnek legyenek egyedi, csak rá jellemző szabálytalanságai.
A cég a következő fejlesztési fázisban tovább akarja javítani a modellek realisztikusságát, valamint a mozgásgenerálásban is előre szeretne lépni.
Már azt is tudják, mire használható
A nagy felbontású virtuális modelleket a japán cég reklám- és ruházati cégeknek akarja értékesíteni. Az algoritmussal ugyanis könnyedén előállíthatják az adott termékhez legjobban illő modellt, akinek nem kell fizetni, nem reklamál, ha a megállapodottnál többet dolgoztatják, nem kell hozzá fotós és így tovább.
A GAN technológián egyébként olyan cégek is dolgoznak, mint az Nvidia, amely az általa fejlesztett StyleGAN forráskódját a GitHubon is közzétette, így annak felhasználásával bárki belefoghat a kísérletezésbe. A StyleGAN is egyelőre az arcgenerálásra koncentrál, és a mintegy 70 ezer portréfotót használtak fel a Flickr-Faces-HQ adatbázisból a tanítására. (Az IBM is ehhez a forráshoz nyúlt, amikor létrehozta az arcfelismerő algoritmusok előítéletmentes tanítását lehetővé tevő adatbázisát.)
A technológia kritikusai arra figyelmeztetnek, hogy az MI által létrehozott és egyre tökéletesebb virtuális figurák csak még jobban alááshatják a digitális térben megjelenő információk iránti bizalmat. Az ember ugyanis az információi zömét a látása révén szerzi. Míg a szövegek valóságtartalmát ellenőrizheti több forrás felkutatásával, a képi információk esetében sokkal korlátozottabbak a lehetőségei, a GAN technológiával létrehozott képek esetében pedig nem is talál majd ilyen kontroll információkat.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak