Nem tűnik teljesen szabályosnak, ahogy napi szinten lekapnak a videómegosztóról annyi filmet, amennyit az emberi felhasználók egész életük során lennének képesek végignézni.
Hirdetés
 

A 404 Media az Nvidiától kiszivárgott dokumentumokra, levelekre és Slack beszélgetésekre hivatkozva számolt be róla, hogy a csipgyártó óriás elképesztő mennyiségű adatot gyűjtött be a YouTube-ról MI-modelljeinek betanításához. Az adatokat ennek alapján felhasználták a vállalat Cosmos mélytanuló modellje, autós önvezető technológiája, MI-avatárjai és a 3D-s Omniverse fejlesztéséhez is, ráadásul a lap értesülései szerint virtuális gépek alkalmazásával és automatikusan változó IP-címekkel igyekeztek elrejteni tevékenységüket a YouTube elől.

A cikkből kiderül, sem az egyes videók készítői, sem a YouTube tulajdonosa, a Google nem járultak hozzá az adatok lekaparásához (data scraping) és ilyen irányú felhasználásához. Ahogy korábban írtuk, a videómegosztó platform felhasználási szabályzatában tiltja az anyagok engedély nélküli begyűjtését, de a nagy MI-fejlesztők a jelek szerint nem törődnek az ilyen szöveges feladatokkal: a YouTube Subtitles nevű, általánosan használt adatkészlet például több mint 48 ezer YouTube-csatorna legalább 173 536 videójának feliratait tartalmazza.

Szabad rablás a fejlődés nevében

A 404 Media által szemlézett dokumentumokból az is látszik, hogy az Nvidiánál házon belül is sokan tettek fel kérdéseket a minimum véleményes adatgyűjtési gyakorlattal kapcsolatban, de a jogi és etikai aggályokat a vezetők (köztük a Cosmos projektért is felelős kutatási alelnökkel) lesöpörték az asztalról. Közben napi szinten annyi videót gereblyéztek össze a YouTube-ról, amennyit egy-egy ember egész élete során nézhetne csak végig, sőt olyan adatkészleteket is felhasználtak, amelyeket kifejezetten tudományos kutatások támogatására szolgálnak.

Az Nvidia a mesterségesintelligencia-ipar központi szereplőjévé vált az általa gyártott, nagy teljesítményű grafikus feldolgozó egységeken (GPU-kon) keresztül, sőt szinte egymagában a számításigényes MI-rendszereket kiszolgáló piacot. Ügyfelei között az OpenAI, a Microsoft vagy a Meta mellett természetesen ott van a Google is, ami még érdekesebbé teszi a helyzetet. A 404 Media kérdésére egyébként az Nvidia azt állította, hogy gyakorlata teljes mértékben megfelel a szerzői jog betűjének és szellemének is, de innentől ezt gyaníthatóan már nem ők fogják eldönteni.

Közösség & HR

Két halálos áldozatot követelt egy félresikerült tűzfalfrissítés

Ausztrália második legnagyobb telekommunikációs cégénél szeptemberben történt a szó szerint végzetes következményekkel járó informatikai incidens. A most nyilvánosságra hozott vizsgálati anyag szerint ehhez emberi tévedések és mulasztások egész sora vezetett.
 
Hirdetés

Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai

Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.

Sok szervezet adatvezéreltnek tartja magát, mert van BI rendszere és heti dashboardja. A valóságban azonban ennél többről van szó; a kérdés ugyanis nem az, hogy van-e elég adat, hanem, hogy mennyire jól használják a döntések meghozatalához.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.