Szerzői jogok megsértése miatt több milliárd dollárra perli az OpanAI-t és a Microsoftot a The New York Times (NYT). A médiavállalat szerint az OpenAI jogellenesen használta fel a NYT cikkeit arra, hogy LLM-jeit (large language model) tanítsa. (A kereset teljes szövege itt érhető el PDF-ben.) A Microsoft úgy kerül a perbe, hogy a szoftvergyártó egyrészt az OpenAI legnagyobb befektetője, másrészt a kérdéses LLM-eket alkalmazza a termékeiben.
A médiavállalat szerint a NYT-tartalmak megjelennek a LLM-ek kimenetében (másolatok, átfogalmazások formájában), valamint a Bingben olyan keresési eredményekként, melyek megtévesztésig hasonlítanak a Bing keresési indexében tárolt NYT-cikkekhez. A lap beadványában hivatkozik arra is, hogy a ChatGPT-vel meg lehet(tett) kerülni a paywallokat.
Azt a NYT is lehetővé teszi, hogy a keresőmotorok elérjék és indexeljék a tartalmát, de arra nem adott engedélyt, hogy tartalmait más célokra, pl. generatív MI képzésére is felhasználják. A médiavállalat beadványában szerint a tartalmak kereskedelmi célú felhasználásáról, amilyen pl. a LLM-ek tanítása is, külön megállapodást kellett volna kötni. Ezért már áprilisban megkeresték a két céget, az egyeztetések azonban nem vezettek eredményre.
A másik fél ezt nem így látta. Az OpenAI szóvivője azt nyilatkozta az Axiosnak, hogy a megbeszélések konstruktívak és eredményesek voltak, jól haladtak a megoldás felé, ezért meglepte őket a médiavállalat lépése .
Nem csak a The New York Times sorsa a tét
A NYT stratégiája érthető. Az 1851-ben alapított nagy presztízsű lap az első között, több mint egy évtizede tért át online felületein is a fizetős modellre. Jelenleg nyomtatott és online változatának összesen több mint 10 millió előfizetője van, és az a cél, hogy számukat öt év alatt másfélszeresére növelje. Jelentős a lap reklámbevétele is, amit részben az biztosít, hogy az olvasócsalogatónak szánt, ingyenesen is elérhető cikkeivel heti 50-100 millió alkalmi olvasót vonz a nytimes.com-on. Az olvasótábor kiszolgálására jelentős, mintegy 2000 fős szerzői gárdát tart fenn.
Ha a feleknek nem sikerül megegyezniük, a per kimenetele hosszabb távon meghatározhatja a szerzői jog védte tartalmak és az LLM-ek viszonyát, de még akár azt is, hogy mekkora értéket képviselnek ezek a tartalmak az LLM-ek képzésében, és mekkora kártérítés jár a korábbi használatuk miatt. Utóbbi téren egyébként a NYT beadványa óvatosan fogalmaz, nem számszerűsíti a kártérítési igényét, csupán az alperesek felelősségre vonását szeretné elérni az őket ért "több milliárd dolláros" tényleges kárért.
Hasonló jellegű perek indultak már az OpenAI és más MI-cégek ellen korábban is. Perelik többek között a GitHubot a Copilotja miatt, a Getty Images a Table Diffusiontől követel kártérítést jogosulatlanul felhasznált képek miatt, de az OpenAI-nak is vannak folyamatban perei például írókkal.
Ezzel szemben például az Axel Springer vagy az Associated Press a "ha nem tudod legyőzni, állj mellé" taktikát követte, és igyekszik hasznot húzni abból, hogy az LLM-fejlesztő cégek úgyis lenyúlják a tartalmait.
A technológiai ipar szintén ellentmondásosan viszonyul a problémához. A Microsoft szeptemberben még magabiztosan jelentette be, hogy vállalja ügyfelei jogi védelmét és az esetlegesen felmerülő kártérítési költségek megtérítését is, ha a termékeibe épített mesterséges intelligencia munkájával kapcsolatban szabadalmi jogsértés történne. Az MI-startupokat finanszírozó kockázati tőkések ellenben idegesek a várható költségek miatt. És közben a szerzői jogi trollok is készülődnek, hogy halásszanak kicsit a zavarosban.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak