Kimutatták, hogy az olvasók nem tudják megkülönböztetni a híres költők verseit egy mesterséges intelligencia alkotásaitól. Sőt: a kutatásban résztvevők jobban kedvelték az MI költeményeit, mint amiket klasszikus vagy kortárs alkotók tollából olvashattak. Tetszetősebbnek ítélték a gép alkotta költői képeket, ütősebbnek a ritmust és így tovább.
A Pittsburghi Egyetem Tudománytörténeti és Tudományfilozófiai Tanszékének két kutatója, Brian Porter és Edouard Machery tíz jelentős angol nyelvű költőtől választott öt-öt verset. Kilencen – Geoffrey Chaucer, William Shakespeare, Samuel Butler, Lord George Byron, Walt Whitman, Emily Dickinson, T.S. Eliot, Allen Ginsberg és Sylvia Plath – klasszikus, nemcsak az angol nyelvű, hanem a világirodalmi kánonba is beépült szerzők, a tizedik pedig egy ismertebb kortárs amerikai feminista költő, Dorothea Lasky, a Columbia Egyetem tanára.
Kísérlet előítéleteink működéséről
A kísérlet első lépésekén a ChatGPT 3.5-tel írattak minden költő stílusában öt-öt verset. Az MI munkáját nem finomították újabb és újabb körökkel, elfogadták, amit elsőre kiköpött magából az "írj egy rövid verset X költő stílusában" parancsra.
A szövegekkel két kísérletet végeztek el. Az elsőben a több mint 1600 kísérleti alanynak véletlenszerűen kiosztották egy-egy költő tíz versét: az öt valódit, és az öt MI-generálta szöveget. Véletlenszerű sorrendben kellett elolvasniuk, majd eldönteni, hogy melyik szöveget alkotta ember, és melyiket MI. Az eredmény, ha úgy tetszik, lehangoló: a kísérleti alanyok nagyobb valószínűséggel választották az MI generált verset emberi alkotásnak, mint a valódi műveket.
A második kísérletben 700 kísérleti személyt arra kértek, hogy értékeljenek 10 (5-5 eredeti és MI-alkotta) véletlenszerűen kiválasztott verset 14 jellemző, például képi világa, ritmikája, hangulata, érzelmi hatása stb. alapján. A kísérleti alanyokat három csoportra osztották. Az első csoportnak azt mondták, minden verset ember írt. A második csoport úgy tudta, minden szöveg az MI alkotása. A harmadik csoportnak nem mondtak semmit, de a "műelemzés" végén megkérdezték, hogy szerintük a verset ember vagy MI alkotta.
Ez a kísérlet megerősítette az első eredményt: valójában az emberek kis valószínűséggel képesek megkülönböztetni az ember és a gép alkotta szövegeket. Sőt, jellemzően a gépi eredményt magasabbra értékelték, mint a klasszikusok alkotásait. És persze működött az előítélet is: amikor úgy tudták, hogy egy vers az MI kimenete, gyengébbnek értékelték a minőségét.
A kutatók végül arra jutottak, hogy a kísérleti alanyok egyszerűen hibás heurisztikát alkalmaznak annak eldöntésére, hogy mit alkotott gép, és mit ember. A mesterséges intelligencia által generált szövegek általában egyszerűbbek, a kevésbé felkészült olvasók számára könnyebben érthetőek voltak. Ezzel szemben a klasszikusok versei jóval összetettebbek, költői képeik értelmét gyakran csak a mögöttes kulturális utalásuk ismeretében lehet felfejteni. Ezeket a bonyolultabb képeket a szöveg forrását nem ismerő alanyok rendre értelmetlennek, inkoherensnek minősítették – az ilyen szövegeket pedig az MI-nek tulajdonították.
Emberibb, mint az ember?
Mint a kutatók írják, azt a jelenséget, hogy az MI-t a kísérleti alanyok emberibbnek tartják, mint az embert, valójában pont az hozza létre, hogy az olvasók várakozása az, hogy az ember által írt verseket szebbnek találják majd, mint amiket egy MI generál. Igen ám, de az MI versei általában könnyebben befogadhatók (értelmezhetők), ezért jellemzően a többség tetszését utóbbiak nyerik el, mivel ők a preferenciáikat – tévesen – az emberi szerzőség bizonyítékainak tekintik.
És akkor már csak egy feladat maradt: elvégezni egy ellenpróbát. Vajh ki írta? Egy költő vagy a ChatGPT? "Jelen idő és múlt idő / A jövő időben talán jelen van, / S a jövő idő ott a múlt időben. / Ha minden idő örökké jelen, / Úgy minden idő helyrehozhatatlan."
A tanulmány hozzáférhető Nature Scientific Reportson »
(feladványunk megfejtése)
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak