A képalkotó algoritmusok fejlődésével egyre nehezebb felismerni, melyik alkotás készült emberi kéz által, és melyiket kotyvasztotta össze boszorkánykonyhájában a mesterséges intelligencia. Erre szolgál remek példával az a kép, amelyet egy a technológia adta lehetőségekkel kísérletező műkedvelő felhasználó osztott meg az interneten pár nappal ezelőtt.
Ahogy az fentebb látható, a generatív MI igencsak mutatós, körkörös vonalak mentén rendezett középkori városkát rakott össze. A kép hangulata és érdekes kompozíciója sokakat levett a lábáról, és az eredetileg Redditen közzétett alkotás villámgyorsan bejárta a világhálót.
Ismeretlenek, szakemberek és "celebek" egyaránt kifejezték csodálatukat és elismerésüket a kép kapcsán. Utóbbi csoportba sorolható az Y Combinator társalapítója, aki szerint nála ez volt az a pont, amikor egy algoritmus alkotása "átment a Turing-teszten."
This was the point where AI-generated art passed the Turing Test for me. https://t.co/IOcJH1TwJ2
— Paul Graham (@paulg) September 11, 2023
Paul Graham átvitt értelemben arra utalt, hogy ha a generatív MI ilyen minőségű munkára képes, akkor ott már elmosódik a határa az emberi és a gépi művészetnek. (Mellékszálként amúgy az is érdekes, hogy mindezt az immár X-nek hívott Twitteren tette közzé, mivel múlt év végén ugyanő azt közölte, hogy befejezte, mert elege van a tulajdonos Elon Musk szeszélyeiből.)
Az internet persze nem hazudtolta meg önmagát, és a lelkesedők mellett feltűntek a kritikusabb kommentárok is. Utóbbiak szerint például az árnyékok elrendezése, vagy éppen a kémények és az ablakok térbeli elhelyezkedése miatt egyértelműnek tűnik, hogy a képet nem ember készítette.
Megcsavart képalkotás
A sok megosztást kiérdemelt képet a Stable Diffusion képszintetizáló modellt és az arra ráépülő ControlNet neurális hálózatot vetette be. Korábban ugyanezzel a párossal olyan működő QR-kódokat alkottak, amelyek egyben képregénykockaként is megállták a helyüket.
A középkori városka úgy született meg, hogy QR-mintázatok helyett spirálokat, illetve sakktáblamintákat táplálta a ControlNetet. Ezt követően pedig már csak be kellett gépelni a "Középkori falusi jelenet forgalmas utcákkal és várral a távolban (mestermű:1,4), (legjobb minőség), (részletes)" utasítást, az algoritmus pedig innen már elvégezte a munka fennmaradó részét. A sakktáblás elrendezésre például az alábbi megoldást szállította a gép.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak