A világ nagyobbik fele ámulatba ejtve nézegette február közepén azokat a kisfilmeket, amelyeket az OpenAI frissen debütáló mesterségesintelligencia-modellje, a szövegből videókat készítő Sora alkotott. Igaz, hogy a gép által összedobott jelenetekben (még) számos hibára bukkanhatnak az alaposabbak, illetőleg egyes konkurens szakértők sem jósolnak neki nagy jövőt, a filmgyártó nagy nyelvi modell (LLM) kétségtelenül területének csúcsát képviseli jelenleg.
Erre a csúcsra azonban lehet, hogy jogszerűtlen eszközökkel jutott az OpenAI. Legalábbis ez olvasható ki a YouTube vezérigazgatója által múlt héten tett kijelentésekből. Neal Mohan a Bloombergnek nyilatkozva arról beszélt, hogy a Google tulajdonában lévő platformon található videók felhasználása egy MI-modell betanítására a YouTube általános szerződési feltételeinek "egyértelmű megsértése" lenne.
Ez a feltételes mód az OpenAI technológiai igazgatójának korábbi, meglehetősen furcsa kijelentésére utalhat. Mira Murati a múlt hónapban adott interjút a Wall Street Journalnak, amelyben arról beszélt, hogy a Sora képzéséhez "nyilvánosan elérhető és licencelt adatokat" használtak. A vállalat CTO-ja azonban arra "nem emlékezett", hogy ebbe beletartozott-e a YouTube mérhetetlen videós adatóceánja.
"Az alkotók szemszögéből nézve, amikor egy alkotó feltölti a kemény munkáját a platformunkra, vannak bizonyos elvárásai. Az egyik ilyen elvárás az, hogy a szolgáltatási feltételeket betartják. Nem engedi meg, hogy olyan dolgokat, mint az átiratok vagy a videódarabok letöltése, és ez egyértelműen sérti a szolgáltatási feltételeinket. Ezek az út szabályai a platformunkon található tartalmak tekintetében".
Kényes kérdés
A generatív algoritmusok térnyerésével szinte mindennapossá váltak azok a jogi és etikai felvetések, miszerint milyen adathalmazokon lehet trenírozni és milyeneken tilos, vagy legalábbis nem erkölcsös egy MI-modellt tanítani. A fejlesztők és az ellentábor leginkább a szerzői jogok kapcsán esett egymásnak a közelmúltban. Februárban egy amerikai bíróság ugyan elutasította négy író közös keresetét, de az OpenAI ellen indított per még így is megvalósulhat, ha a felperesek sikerrel módosítják beadványukat.
A legnagyobb visszhangja talán a The New York Times tavalyi keresetének volt. A lap azért perelte be az OpenAI-t, mert álláspontja szerint utóbbi szerzői jogvédelem alatt álló anyagok jogellenes felhasználásával okozott kárt. Ezzel szemben például az Axel Springer vagy az Associated Press a "ha nem tudod legyőzni, állj mellé" taktikát követte, és igyekszik hasznot húzni abból, hogy az LLM-fejlesztő cégek úgyis lenyúlják a tartalmait.
A kiadók és az OpenAI birkózása mellett említhető több más frontvonal is, ahol az egyik oldalon MI-cégek, a másikon illegális felhasználást emlegető sértettek vannak. Perelik többek között a GitHubot a Copilotja miatt, a Getty Images pedig a Table Diffusiontől követel kártérítést jogosulatlanul felhasznált képek miatt.
Az OpenAI-t egyébként annyira nem rettentették el a jogi lépések, mivel a Wall Street Journal beszámolója szerint a cégnél azt tervezik, hogy a ChatGPT-5 képzéséhez többek között a YouTube-ról származó videók átiratát is felhasználják.
(Kép: OpenAI/Sora)
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak