Szabad rablást rendeznek a YouTube-on az MI-ipar nagyágyúi

Bitport2024.07.19.Piaci hírek

Bár a videómegosztó platform világossá teszi, hogy az oldalain megjelenő videók milyen jogi védettséget élveznek, a nagy techvállalatokat ez nem feltétlenül hozza zavarba.

A mesterséges intelligenciát fejlesztő vállalatok hagyományosan a publikus online felületekről tömegesen letöltött adatokkal táplálják az MI-modelleket (data scraping), ami önmagában is ellentmondásos dolog, ráadásul a cégek gyakran titkolják a képzési adatok forrásait. A Wired néhány nappal ezelőtt megjelent tudósítása ezt a gyakorlatot szemlélteti egy újabb példán keresztül: a lap a Proof News vizsgálatára hivatkozva azt írja, hogy a legnagyobb MI-cégek sok ezer YouTube-videót használták fel erre a célra, miközben maga a YouTube felhasználási szabályzatában tiltja az anyagok engedély nélküli begyűjtését.

A Proof News egyik kutatásáról mi is beszámoltunk február végén, amikor a vezető MI-modelleket tesztelő szakértők úgy találtákarra jutottak, hogy a robotok válaszai gyakran pontatlanok, félrevezetőek, sőt kifejezetten károsak, ha valaki a választásokkal kapcsolatos információkról érdeklődik náluk. A mostani vizsgálat során pedig az derült ki, hogy több mint 48 ezer YouTube-csatornáról legalább 173 536 videó feliratait szippanthatták fel olyan nehézsúlyú iparági versenyzől, mint az Anthropic, az Nvidia, az Apple vagy a Salesforce – természetesen ebben az esetben is az alkotók engedélye nélkül.

Feloldhatatlannak tűnő ellentétek

A "YouTube Subtitles" néven ismert adatkészletet a cikk alapján még 2020-ban jelent meg, és különféle anyagok leiratait tartalmazza az MIT-től és a Harvard-tól a BBC-n keresztül a MrBeast-hez hasonló youtuberekig. A Proof News több érintett csatornatulajdonossal is felvette a kapcsolatot, akik közül állítólag senkit sem értesített az adatkészletet létrehozó EleutherAI a videókból kiemelt feliratok felhasználásáról. A Wirednek nyilatkozó egyik kutató ehhez képest megerősítette, hogy a "YouTube Subtitles" valódi aranybányát jelent az emberi beszéd MI-alapú replikációjával foglalkozó fejlesztőknek.

Az egyik érintett alkotó azt emlegeti a riportban, hogy a maga részéről időt, pénzt és más erőforrásokat öl a tartalom létrehozásába, és ha ebből mások is hasznot akarnak húzni, akkor mindenképpen beszélni kellene a kompenzációról és az ilyen felhasználások szabályozásáról. A helyzetet persze bonyolítja az az átláthatatlan működés, ahogy az MI-modelleket trenírozzák, a "békés rendezés" kilátásait pedig jól mutatja, amikor például a Microsoft konzumer MI-részlegének vezetője teljesen komolyan előadja, hogy szerinte a publikus weben közzétett anyagok automatikusan szabad felhasználásúvá válnak.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Piaci hírek

Az MI-szerverek gyorsan kicsapják a biztosítékot

A Gartner jelentése szerint jövőre már több energiát fogyasztanak a ChatGPT és társai futtatására szolgáló gépek, mint a hagyományos szerverek. Nagy gond viszont, hogy ezt a rohamot nehezen tudják kiszolgálni az elektromos hálózatok.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Az MI-szerverek gyorsan kicsapják a biztosítékot

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!