Mustafa Suleyman, aki a Google-Deep Mind és az Inflection AI után éppen a Microsoft konzumer MI-részlegét irányítja, ahol olyan termékekkel foglalkozik, mint a Copilot, a Bing, az Edge vagy a GenAI fejlesztései. Ellentmondásos vezetői karrierje ellenére sikeres és nagy hatású szakember a mesterséges intelligencia területén, ezért a nyilatkozatait is gyakran idézik különböző kérdésekben – legutóbb éppen azt a CNBC-s interjút, amelyben megosztotta néhány gondolatát a publikus interneten elérhető anyagok méltányos használatávalal kapcsolatban.
A dolog különösebb jogi felkészültség hiányában is érdekes, Suleyman szerint ugyanis abban a pillanatban, amikor bárki bármit közzétesz a nyílt weben, az "freeware" anyaggá válik, amit mások szabadon másolhatnak és használhatnak. A riporter természetesen azt feszegeti, hogy az MI-cégek tényleg nagyüzemben lopják-e a világ szellemi tulajdonát, amire a Microsoft AI vezérigazgatója kifejti, hogy a 90-es évek óta élő "társadalmi szerződés" értelmében valóban lehetőségük van a világhálóról felporszívózni a generatív MI-modellek képzési adatait.
A beszélgetést természetesen sok helyen felkapták, mert még ebben a műfajban is ritkaság, hogy egy ilyen fontos szakember ekkora tévedést hirdet a nyilvánosság előtt. Ahogy a The Verge beszámolója is felhívja rá a figyelmet, sok helyen (és így az Egyesült Államokban is) a különféle művek a létrehozásuk pillanatában automatikusan a szerzői jog védelme alá kerülnek, ezeket a jogokat pedig senki sem veszti el azzal, hogy a munkáját közzéteszi az interneten – nem véletlenül volt szükség az új médiumra szabott, speciális webes licencek kidolgozására.
Őket is különleges anyagból gyúrták
Ugyanígy furcsa lenne, ha a méltányos használatot valamiféle társadalmi szerződés, és nem a bíróságok döntése alapján kellene meghatározni. Bár a szerzői jog által védett anyagoknak is legálisak bizonyos felhasználásai, ahhoz már mérlegelésre van szükség, hogy mit, milyen céllal, milyen mennyiségben másolnak le, és hogy ezzel a jogtulajdonosokat éri-e bármilyen kár. Suleyman megfejtése ehhez képest nagyjából annyiban foglalható össze, hogy az online elérhető tartalmakat a big tech cégek alapértelmezett módon méltányosan használják.
Az elképzelés egyébként már azon is könnyen fejre áll, hogy a ChatGPT 2022 végi megjelenését megelőzően csak kevés felhasználó gondolhatta, hogy online közzétett szövegei, képei, videói vagy bármilyen más kreatív munkja a mesterséges intelligencia képzési anyagává változhat majd. Azt Suleyman is elismerte, hogy azok a webhelyek külön kategóriéba esnek, amelyek aktívan blokkolják az adatokat gyűjtögető webes robotokat, de még ezt is "szürke területnek" nevezte, teljesen sajátos módon értelmezve egy újabb jogi problémát.
Másképpen tudniillik nehéz lenne belátni, hogy ha valaki explicit megtiltja publikus felületein az adatok tömeges letöltését (data scraping), akkor miért esne a szürke zónába a beleegyezés nélkül végzett tevékenység. Igaz, a gyakorlatban az MI-fejlesztők ugyanezzel a hozzáállással dolgoznak, legfeljebb nem kezdik el fejtegetni az álláspontjukat a CNBC-nek. És nagy meglepetésekre ott sem kell számítani: legutóbb például OpenAI technológiai vezetője mondta bele a mikrofonba, hogy talán nem is kár az MI-őrületben tömegével megszűnő állásokért.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak