Inkább bele sem gondolunk abba, honnan jöhetett a japán kutatóknak az az ötlete, hogy mesterséges intelligencia (MI) segítségével hozzanak létre realisztikus, de valóságban nem létező divatmodelleket. A Kiotói Egyetem kampuszán működő DataGrid nevű cég kidolgozott egy olyan mélytanuláson alapuló MI algoritmust (japánul tudók itt informálódhatnak), amely fotorealisztikus emberek képét tudja létrehozni, sőt a modelleket valósághűen meg is tudja mozdítani – természetesen csak a virtuális térben.
Létező technológiát tökéletesítettek
A legjobb az egészben, hogy a folyamat szinte teljesen automatikus. A japánok egyébként nem találtak kis semmi újat. Ők is az ún Generative Adversarial Network (GAN) technológiát használták, amely algoritmus eredendően egy általános eszköz valósághű objektumok létrehozására. Az, hogy ez az objektum egy emberek utánzata vagy valami más, a fejlesztés szempontjából mindegy, bár az kétségtelen, hogy fotorealisztikus vasgolyót – a formát és a textrúrát – lényegesen egyszerűbb létrehozni, mint egy embert. A technológia a videojáték-fejlesztők körében is egyre elterjedtebb.
De azért a DataGrid beletett saját mélytanulási algoritmusába néhány innovatív újítást. Mindenekelőtt az eddig főleg arcok generálására használt technológiát kiterjesztette a teljes emberi testre, valamint a mozgásra. Emellett sikerült megoldaniuk azt is, hogy az arcok ne legyenek túl szabályosak (szigorú szimmetria, szabályos fogazat, bőrszín egyneműsége stb.), hanem ahogy a való életben, minden modellnek legyenek egyedi, csak rá jellemző szabálytalanságai.
A cég a következő fejlesztési fázisban tovább akarja javítani a modellek realisztikusságát, valamint a mozgásgenerálásban is előre szeretne lépni.
Már azt is tudják, mire használható
A nagy felbontású virtuális modelleket a japán cég reklám- és ruházati cégeknek akarja értékesíteni. Az algoritmussal ugyanis könnyedén előállíthatják az adott termékhez legjobban illő modellt, akinek nem kell fizetni, nem reklamál, ha a megállapodottnál többet dolgoztatják, nem kell hozzá fotós és így tovább.
A GAN technológián egyébként olyan cégek is dolgoznak, mint az Nvidia, amely az általa fejlesztett StyleGAN forráskódját a GitHubon is közzétette, így annak felhasználásával bárki belefoghat a kísérletezésbe. A StyleGAN is egyelőre az arcgenerálásra koncentrál, és a mintegy 70 ezer portréfotót használtak fel a Flickr-Faces-HQ adatbázisból a tanítására. (Az IBM is ehhez a forráshoz nyúlt, amikor létrehozta az arcfelismerő algoritmusok előítéletmentes tanítását lehetővé tevő adatbázisát.)
A technológia kritikusai arra figyelmeztetnek, hogy az MI által létrehozott és egyre tökéletesebb virtuális figurák csak még jobban alááshatják a digitális térben megjelenő információk iránti bizalmat. Az ember ugyanis az információi zömét a látása révén szerzi. Míg a szövegek valóságtartalmát ellenőrizheti több forrás felkutatásával, a képi információk esetében sokkal korlátozottabbak a lehetőségei, a GAN technológiával létrehozott képek esetében pedig nem is talál majd ilyen kontroll információkat.
Költségcsökkenésből finanszírozott modernizáció
A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?