Elképesztő mennyiségű adatot szippant le az Nvidia a YouTube-ról

Bitport2024.08.06.Közösség & HR

Nem tűnik teljesen szabályosnak, ahogy napi szinten lekapnak a videómegosztóról annyi filmet, amennyit az emberi felhasználók egész életük során lennének képesek végignézni.

A 404 Media az Nvidiától kiszivárgott dokumentumokra, levelekre és Slack beszélgetésekre hivatkozva számolt be róla, hogy a csipgyártó óriás elképesztő mennyiségű adatot gyűjtött be a YouTube-ról MI-modelljeinek betanításához. Az adatokat ennek alapján felhasználták a vállalat Cosmos mélytanuló modellje, autós önvezető technológiája, MI-avatárjai és a 3D-s Omniverse fejlesztéséhez is, ráadásul a lap értesülései szerint virtuális gépek alkalmazásával és automatikusan változó IP-címekkel igyekeztek elrejteni tevékenységüket a YouTube elől.

A cikkből kiderül, sem az egyes videók készítői, sem a YouTube tulajdonosa, a Google nem járultak hozzá az adatok lekaparásához (data scraping) és ilyen irányú felhasználásához. Ahogy korábban írtuk, a videómegosztó platform felhasználási szabályzatában tiltja az anyagok engedély nélküli begyűjtését, de a nagy MI-fejlesztők a jelek szerint nem törődnek az ilyen szöveges feladatokkal: a YouTube Subtitles nevű, általánosan használt adatkészlet például több mint 48 ezer YouTube-csatorna legalább 173 536 videójának feliratait tartalmazza.

Szabad rablás a fejlődés nevében

A 404 Media által szemlézett dokumentumokból az is látszik, hogy az Nvidiánál házon belül is sokan tettek fel kérdéseket a minimum véleményes adatgyűjtési gyakorlattal kapcsolatban, de a jogi és etikai aggályokat a vezetők (köztük a Cosmos projektért is felelős kutatási alelnökkel) lesöpörték az asztalról. Közben napi szinten annyi videót gereblyéztek össze a YouTube-ról, amennyit egy-egy ember egész élete során nézhetne csak végig, sőt olyan adatkészleteket is felhasználtak, amelyeket kifejezetten tudományos kutatások támogatására szolgálnak.

Az Nvidia a mesterségesintelligencia-ipar központi szereplőjévé vált az általa gyártott, nagy teljesítményű grafikus feldolgozó egységeken (GPU-kon) keresztül, sőt szinte egymagában a számításigényes MI-rendszereket kiszolgáló piacot. Ügyfelei között az OpenAI, a Microsoft vagy a Meta mellett természetesen ott van a Google is, ami még érdekesebbé teszi a helyzetet. A 404 Media kérdésére egyébként az Nvidia azt állította, hogy gyakorlata teljes mértékben megfelel a szerzői jog betűjének és szellemének is, de innentől ezt gyaníthatóan már nem ők fogják eldönteni.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

Kisebbfajta csodavárást tükröz a K&H új innovációs indexe

Az index történetében soha nem voltak ennyire optimisták a magyarországi vállalatok. Elkészült a bank választások utáni első felmérése.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Kisebbfajta csodavárást tükröz a K&H új innovációs indexe

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!