A tartalomszolgáltatók sorra vezetik be a korlátozásokat az általuk közölt anyagok felhasználására, miközben a mesterséges intelligencia egyre többet követelne magának.
Hirdetés
 

Az utóbbi időben egyre gyakrabban jelennek meg figyelmeztetések a nagy nyelvi modellek (LLM-ek) fejlesztésének egyik komoly akadályáról, nevezetesen arról, hogy belátható időn belül elapadhatnak a képzésükhöz felhasználható adatok. Ez nem elsősorban arra vonatkozik, hogy kimerülnek a publikus internet erőforrásai (bár azok sem végtelenek), hanem abból fakad, hogy a tartalom begyűjtését és alkalmazását is egyre szigorúbban ellenőrzik. Vagyis a nyilvános online források köre szűkül a YouTube-videóktól kezdve az újságcikkekig, miközben a generatív mesterséges intelligencia fejlesztéséhez mindig több és több adatra lenne szükség.

A Massachusetts Institute of Technology keretei között működő Data Provenance Initiative tanulmánya alapján a szóban forgó korlátozások tényleges válságot idézhetnek elő: ha valóban betartjk és betartatják a szóban forgó korlátozásokat, akkor az nagyon gyorsan eltorzíthatja az általános célú MI-rendszerek frissességét, sokféleségét és méretezési lehetőségeit. A kutatók összesen 14 ezer olyan webhelyet vizsgáltak meg, amelyek forrásként szerepelnek az MI betanítására használt prominens adatkészletekben, és úgy találták, hogy a legaktívabban karbantartott, kritikus források körülbelül 28 százaléka már most sem hozzáférhető.

Már az alapoknál gondok vannak

Már 2022 végén is lehetett olvasni olyan előrejelzéseket, amelyek értelmében a gépi tanuló rendszerek akár 2026 előtt kimeríthetik a jó minőségű nyelvi adatokat. A dolog pedig egyre reálisabbnak tűnik, ahogy egyre kevesebben tolerálják, hogy az MI-fejlesztők pénzt keresnek a szerzői jogi védelem alatt álló anyagaikra támaszkodva. A küzdelem ráadásul elvi alapon is zajlik, amikor az OpenAI technológiai igazgatója például simán kijelenti, hogy nem lesz kár bizonyos kreatív munkák eltűnéséért – miközben éppen nekik köszönhetők mindazok a tartalmak, amelyek révén az OpenAI ChatGPT és más MI-alkalmazások felépülhettek.

Visszatérve a Data Provenance Initiative kutatására, a dokumentum felhívja a figyelmet az MI-specifikus felhasználási záradékok terjedésére és azokra a nem hatékony webes protokollokra (akár a webes feltételek és a robots.txt fájlok közti ellentmondásokra), amelyek jelzik, hogy az eddig ismert internetet nem az MI-alapú, átfogó "újrahasznosításra" találták ki. A fejlesztők szintetikus adatok gyártásával vagy a médiavállalatokkal kötött megállapodásokkal próbálják kezelni a problémát, de az előbbiek nem feltétlenül alkalmasak az emberek által előállított tartalom kiváltására, utóbbiakat pedig meghatározzák a két oldal közti alapvető érdekellentétek.

Részletek az MIT Data Provenance Initiative kutatásában »

Piaci hírek

Trump alelnöke szerint Európa saját magát nyírja ki az MI-szabályozással

A párizsi MI-csúcson JD Vance bemutatta az új politikai irányt, megdorgálta az EU-t, és belerúgott Kínába is.
 

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT A PROJEKTMENEDZSMENTRŐL TUDNI KELL!

Ütős esettanulmányok AI-ról, agilitásról, hibrid működésről, elosztott csapatokról, kulturális gapek kezeléséről. Exkluzív információk képzésekről, munkaerőpiacról, kereseti és karrierlehetőségekről.

2025.03.18. Symbol Budapest

RÉSZLETEK »

Az informatikai rendszerek üzemeltetése és a szoftverfejlesztés egyre kevésbé képzelhető el mesterséges intelligencia nélkül. Honnan indultunk és hol tartunk most, miért vált elavulttá a klasszikus monitoring?

a melléklet támogatója a Dynatrace

Hirdetés

Szakmai nap a jövőálló digitális infrastruktúra jegyében

A digitális infrastruktúra új kihívásai - legyen szó MI megoldásokról, szigorodó fenntarthatósági követelményekről, vagy az reziliens és szünetmentes működésről - szinte minden nagyobb szervezet életében meghatározó szerepet játszanak. Egy szakmai rendezvénysorozat segítségével közelebb kerülhetünk a megoldásokhoz és segítséget kaphatunk az új technológiák sikeres implementálásához.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.