Új trükk védi a műalkotásokat a gátlástalan mesterséges intelligenciától

Bitport2023.02.20.Konzumer tech

Az emberi szem nem igazán észleli a változtatásokat, amelyek azonban képesek összezavarni az ilyen referencia alapján betanított generatív MI-rendszereket.

A Chicagói Egyetem kutatói a múlt héten ismertették azt az általuk fejlesztett új technikát, amelyik szándékaik szerint megvédheti a művészeket a stílusukat és képeiket másoló mesterségesintelligencia-modellektől. A már kereskedelmi forgalomban is elérhető, szöveges utasítások alapján képeket előállító eszközök (DALL-E, Stable Diffusion, Midjourney stb.) az utóbbi időben egyre hevesebb vitákat váltanak ki, miután az alkotóknak is feltűnt, hogy mennyire egyszerűvé vált a munkájukat utánzó digitális műalkotások elkészítése. A szóban forgó neurális hálózatokat lényegében válogatás nélkül tanítják be az interneten elérhető képgyűjtemények felhasználásával, de erre a jogtulajdonosoktól nem kérnek engedélyt, akiknek arra sincsenek hatékony eszközeik, hogy utólag kivonják munkáikat az adatkészletekből.

A felháborodás eredményeként már csoportos keresetet nyújtottak be a képgenerátorok üzemeltetőivel szemben, a képbankok (stock images) közül pedig a Getty Images is a bíróságon keresi az igazát, amiért szabadalmaztatott képeit azok felirataival és metaadataival együtt használják az MI-modellek képzésére. Az ilyen rendszerek aztán hajlamossá válnak az eredetihez megszólalásig hasonlító tartalmak létrehozására, a mesterségesen generált képek némelyikén még a Getty vízjele is felfedezhető. A dolog abból a szempontból is érdekes, hogy az új technológiák nyomán újra kell értelmezni az alkotói szabadság vagy az alkotói gazdaság (creator economy) meghatározásait: nemrég egy amerikai bíróság az NFT-kről állapította meg, hogy azoka gyakorlatban inkább árucikkekhez, és nem műalkotásokhoz hasonlítanak.

A semminél sokkal több

Visszatérve a Chicagói Egyetemen kifejlesztett, Glaze néven hivatkozott programra, az állítólag képes megakadályozni, hogy a szöveget képpé alakító MI-modellek megtanulják a művészi stílusok hatékony utánzását. A szoftver megvizsgálja a képeket, és meghatározza, melyek lehetnek a minőségüket meghatározó vizuális elemek, mint amilyenek az ecsetvonások, formák vagy paletták. Ezután a kiválasztott jellemzőket úgy módosítja, hogy egy emberi szemmel nem igazán észrevehető, új réteget helyez el a képekre, vagyis elválasztja a stílusjegyeket a képektől és azok tárgyától. Tulajdonképpen egy "stílusátviteli algoritmusról" van szó, amelyik a képek eredeti megjelenését más stílusokkal ötvözi, ennek eredményeként pedig a képeken betanított MI-modellek nem lesznek képesek azonosítani a meghatározó jegyeket.

Balra az eredeti festmény, középen a stílust utánzó MI alkotása, jobbra pedig egy olyan kép, amit a Glaze által módosított eredetiből hozott ki

forrás: https://news.uchicago.edu

A megoldás előnye, hogy nem módosítja érdemben a digitálisan közzétett eredeti alkotások megjelenését, de a számítógépek rosszul értelmezik azokat. A beszámolók szerint a kutatók a program ingyenes közzétételét tervezik, hogy a művészek előre biztosíthassák a képeiket, mielőtt feltöltenék az internetre. Érdemes persze megjegyezni, hogy az ilyen jellegű védelem nem ad választ a a mesterséges intelligenciával kapcsolatos szerzői jogi kérdésekre, és nem oldja meg az MI-alapú utánzás problémáit – már csak azért sem, mert az MI-technológiák nagyon gyorsan fejlődnek, ezért nincs garancia a Glaze vagy bármely hasonló megoldás jövőállóságára. A szoftver fejlesztői abban bíznak, hogy némileg javíthatnak a művészek lehetőségein, amíg erőre kapnak a hosszabb távú szabályozást célzó erőfeszítések.

Konzumer tech

Okos hangszóró lehet az OpenAI első hardvere

Kiszivárgott információk szerint a ChatGPT fejlesztője mozgó alkatrészekkel és személyiségjegyekkel igyekszik "emberibbé" tenni végfelhasználókat célzó első fizikai termékét.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Okos hangszóró lehet az OpenAI első hardvere

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!