A Chicagói Egyetem kutatói a múlt héten ismertették azt az általuk fejlesztett új technikát, amelyik szándékaik szerint megvédheti a művészeket a stílusukat és képeiket másoló mesterségesintelligencia-modellektől. A már kereskedelmi forgalomban is elérhető, szöveges utasítások alapján képeket előállító eszközök (DALL-E, Stable Diffusion, Midjourney stb.) az utóbbi időben egyre hevesebb vitákat váltanak ki, miután az alkotóknak is feltűnt, hogy mennyire egyszerűvé vált a munkájukat utánzó digitális műalkotások elkészítése. A szóban forgó neurális hálózatokat lényegében válogatás nélkül tanítják be az interneten elérhető képgyűjtemények felhasználásával, de erre a jogtulajdonosoktól nem kérnek engedélyt, akiknek arra sincsenek hatékony eszközeik, hogy utólag kivonják munkáikat az adatkészletekből.
A felháborodás eredményeként már csoportos keresetet nyújtottak be a képgenerátorok üzemeltetőivel szemben, a képbankok (stock images) közül pedig a Getty Images is a bíróságon keresi az igazát, amiért szabadalmaztatott képeit azok felirataival és metaadataival együtt használják az MI-modellek képzésére. Az ilyen rendszerek aztán hajlamossá válnak az eredetihez megszólalásig hasonlító tartalmak létrehozására, a mesterségesen generált képek némelyikén még a Getty vízjele is felfedezhető. A dolog abból a szempontból is érdekes, hogy az új technológiák nyomán újra kell értelmezni az alkotói szabadság vagy az alkotói gazdaság (creator economy) meghatározásait: nemrég egy amerikai bíróság az NFT-kről állapította meg, hogy azoka gyakorlatban inkább árucikkekhez, és nem műalkotásokhoz hasonlítanak.
A semminél sokkal több
Visszatérve a Chicagói Egyetemen kifejlesztett, Glaze néven hivatkozott programra, az állítólag képes megakadályozni, hogy a szöveget képpé alakító MI-modellek megtanulják a művészi stílusok hatékony utánzását. A szoftver megvizsgálja a képeket, és meghatározza, melyek lehetnek a minőségüket meghatározó vizuális elemek, mint amilyenek az ecsetvonások, formák vagy paletták. Ezután a kiválasztott jellemzőket úgy módosítja, hogy egy emberi szemmel nem igazán észrevehető, új réteget helyez el a képekre, vagyis elválasztja a stílusjegyeket a képektől és azok tárgyától. Tulajdonképpen egy "stílusátviteli algoritmusról" van szó, amelyik a képek eredeti megjelenését más stílusokkal ötvözi, ennek eredményeként pedig a képeken betanított MI-modellek nem lesznek képesek azonosítani a meghatározó jegyeket.
Balra az eredeti festmény, középen a stílust utánzó MI alkotása, jobbra pedig egy olyan kép, amit a Glaze által módosított eredetiből hozott ki
forrás: https://news.uchicago.edu
A megoldás előnye, hogy nem módosítja érdemben a digitálisan közzétett eredeti alkotások megjelenését, de a számítógépek rosszul értelmezik azokat. A beszámolók szerint a kutatók a program ingyenes közzétételét tervezik, hogy a művészek előre biztosíthassák a képeiket, mielőtt feltöltenék az internetre. Érdemes persze megjegyezni, hogy az ilyen jellegű védelem nem ad választ a a mesterséges intelligenciával kapcsolatos szerzői jogi kérdésekre, és nem oldja meg az MI-alapú utánzás problémáit – már csak azért sem, mert az MI-technológiák nagyon gyorsan fejlődnek, ezért nincs garancia a Glaze vagy bármely hasonló megoldás jövőállóságára. A szoftver fejlesztői abban bíznak, hogy némileg javíthatnak a művészek lehetőségein, amíg erőre kapnak a hosszabb távú szabályozást célzó erőfeszítések.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak