A Midjourney határozatlan időre kitiltotta szolgáltatásából a Stability AI alkalmazottait, miután március elején "botnethez hasonló tevékenységet" észlelt versenytársának részéről, ahogy az tömegesen próbált lekaparni tőle utasításokból (promptokból) és az utasítások eredményeként létrehozott képekből álló párokat. Az adatkaparásnak (data scraping) nevezett gyakorlat a weben hozzáférhető adatok tömeges lemásolását takarja, amit a dolog időbeli és mennyiségi követelményei miatt automatizált eszközökkel végeznek, és a megfelelő formátumba exportálva más alkalmazásokban is közvetelnül felhasználhatnak.
Mind a Midjourney, mind a Stability AI Stable Diffusion 3 modellje szöveges parancsok alapján szintetizál digitális képeket, az pedig egyértelmű, hogy a promptok és ahozzájuk tartozó kimenetek elemzése hogyan segítheti a rivális termékek képzését vagy finomhangolását. Miután az extrém terhelés 24 órás kiesést okozott a Midjourney kereskedelmi szolgáltatásban, a társaság új irányelvet tett közzé, melynek alapján az "agresszív automatizálásra" vagy a szolgáltatás megakasztására válaszul ki fogja tiltani az érintett vállalatok összes alkalmazottját – olvasható az Ars Technika nemrég közzétett beszámolójában.
Minden pofon jó helyre megy?
A lap és a kommentárok nagy része is ironikusnak találta a Midjourney keménykedését, tekintettel arra, hogy a cég más MI-fejlesztőkhöz hasonlóan az internetről engedély nélkül lekapart adatokkal képezte ki saját modelljeit. Az iparági szereplők gyakran odáig mennek, hogy közérdeknek nevezik a jogvédett tartalmakhoz való, soron kívüli hozzáférésüket az MI-modellek betanításához, közben pedig a szerzői jogra hivatkozva védik saját rendszereiket és azok kimeneteit. Maga a Midjourney is előfizetési díjat szed MI-képgenerátorának használatáért, ami eleve azért létezik, mert készítői felporszívózták az internetet.
A Stability AI vezérigazgatója közben vizsgálatot ígért az ügyben, és kijelentette, hogy szándékos károkozásról nem lehetett szó. Szerinte nincs szükségük ilyen adatforrásara, mert egyrészt "szintetikus és egyéb adatokat" használnak, és a webről is csak a megfelelő robots.txt beállítások mellett gyűjtögetnek, másrészt a Stable Diffusion 3 teljesítménye "minden más modellt felülmúl". A Midjourney vezetője erre válaszul azt közölte, hogy "átkülött nekik néhány információt", ezzel is segítve a vizsgálatot. Egyelőre tehát zavarosnak tűnik a dolog, de a végén érdekes lesz meghallgatni, miben különbözik az érintett cégek üzleti modelljétől.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak