Szerzői jogok megsértése miatt több milliárd dollárra perli az OpanAI-t és a Microsoftot a The New York Times (NYT). A médiavállalat szerint az OpenAI jogellenesen használta fel a NYT cikkeit arra, hogy LLM-jeit (large language model) tanítsa. (A kereset teljes szövege itt érhető el PDF-ben.) A Microsoft úgy kerül a perbe, hogy a szoftvergyártó egyrészt az OpenAI legnagyobb befektetője, másrészt a kérdéses LLM-eket alkalmazza a termékeiben.
A médiavállalat szerint a NYT-tartalmak megjelennek a LLM-ek kimenetében (másolatok, átfogalmazások formájában), valamint a Bingben olyan keresési eredményekként, melyek megtévesztésig hasonlítanak a Bing keresési indexében tárolt NYT-cikkekhez. A lap beadványában hivatkozik arra is, hogy a ChatGPT-vel meg lehet(tett) kerülni a paywallokat.
Azt a NYT is lehetővé teszi, hogy a keresőmotorok elérjék és indexeljék a tartalmát, de arra nem adott engedélyt, hogy tartalmait más célokra, pl. generatív MI képzésére is felhasználják. A médiavállalat beadványában szerint a tartalmak kereskedelmi célú felhasználásáról, amilyen pl. a LLM-ek tanítása is, külön megállapodást kellett volna kötni. Ezért már áprilisban megkeresték a két céget, az egyeztetések azonban nem vezettek eredményre.
A másik fél ezt nem így látta. Az OpenAI szóvivője azt nyilatkozta az Axiosnak, hogy a megbeszélések konstruktívak és eredményesek voltak, jól haladtak a megoldás felé, ezért meglepte őket a médiavállalat lépése .
Nem csak a The New York Times sorsa a tét
A NYT stratégiája érthető. Az 1851-ben alapított nagy presztízsű lap az első között, több mint egy évtizede tért át online felületein is a fizetős modellre. Jelenleg nyomtatott és online változatának összesen több mint 10 millió előfizetője van, és az a cél, hogy számukat öt év alatt másfélszeresére növelje. Jelentős a lap reklámbevétele is, amit részben az biztosít, hogy az olvasócsalogatónak szánt, ingyenesen is elérhető cikkeivel heti 50-100 millió alkalmi olvasót vonz a nytimes.com-on. Az olvasótábor kiszolgálására jelentős, mintegy 2000 fős szerzői gárdát tart fenn.
Ha a feleknek nem sikerül megegyezniük, a per kimenetele hosszabb távon meghatározhatja a szerzői jog védte tartalmak és az LLM-ek viszonyát, de még akár azt is, hogy mekkora értéket képviselnek ezek a tartalmak az LLM-ek képzésében, és mekkora kártérítés jár a korábbi használatuk miatt. Utóbbi téren egyébként a NYT beadványa óvatosan fogalmaz, nem számszerűsíti a kártérítési igényét, csupán az alperesek felelősségre vonását szeretné elérni az őket ért "több milliárd dolláros" tényleges kárért.
Hasonló jellegű perek indultak már az OpenAI és más MI-cégek ellen korábban is. Perelik többek között a GitHubot a Copilotja miatt, a Getty Images a Table Diffusiontől követel kártérítést jogosulatlanul felhasznált képek miatt, de az OpenAI-nak is vannak folyamatban perei például írókkal.
Ezzel szemben például az Axel Springer vagy az Associated Press a "ha nem tudod legyőzni, állj mellé" taktikát követte, és igyekszik hasznot húzni abból, hogy az LLM-fejlesztő cégek úgyis lenyúlják a tartalmait.
A technológiai ipar szintén ellentmondásosan viszonyul a problémához. A Microsoft szeptemberben még magabiztosan jelentette be, hogy vállalja ügyfelei jogi védelmét és az esetlegesen felmerülő kártérítési költségek megtérítését is, ha a termékeibe épített mesterséges intelligencia munkájával kapcsolatban szabadalmi jogsértés történne. Az MI-startupokat finanszírozó kockázati tőkések ellenben idegesek a várható költségek miatt. És közben a szerzői jogi trollok is készülődnek, hogy halásszanak kicsit a zavarosban.
Az ötlettől az értékteremtésig – az üzleti réteg szerepe az adattudományi működésben
Az adattudomány valódi értéke ott válik láthatóvá, ahol az előrejelzések döntésekké, a döntések pedig mérhető üzleti eredményekké alakulnak. Ehhez azonban tudatos üzleti beágyazásra, mérési keretrendszerekre és következetes visszacsatolásra is szükség van.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak