Az MI-fejlesztők lehetetlennek tartották, de kiderült, hogy egyáltalán nem az

Bitport2025.06.11.Cloud & big data

Egyetemi kutatók a gyakorlatban is bemutatták, hogy a mesterséges intelligencia képzésében egyáltalán nem szükségszerű a szerzői jogok semmibevétele, és működik az átláthatóbb, bár kétségtelenül időigényesebb alternatíva a webes tartalmak engedély nélküli használatával szemben.

A Washington Post beszámolója szerint az MIT, a Cornell Egyetem, a Torontói Egyetem és más intézmények munkatársai betanítottak egy nagy nyelvi modellt (LLM-et) kizárólag nyílt forrású licenccel vagy közkincsként kezelt adatok felhasználásával. A feladat egyáltalán nem volt könnyű, hiszen nem a számítási teljesítmény, hanem az emberi erőforrások jelentették a szűk keresztmetszetet: a több tucat MI-kutatónak egy több mint nyolc terabájtos adathalmazt kellett manuálisan megtisztítania és újraformáznia, hogy a szöveget alkalmassá tegye a mesterséges intelligencia képzésére.

Ahogy a cikkből is kiderül, hihetetlen mennyiségű plusz munkát jelentett az adatok szerzői jogi státuszának ellenőrzése és újraellenőrzése, mivel sok online tartalom nincs megfelelően licencelve. Bár munkájuk során ők is automatizált eszközöket használtak, a manuális annotációt és az egyes személyek ellenőrzését nem úszhatták meg, mire elkészültek a 7 milliárd paraméterrel működő LLM betanításával. Az eredmény azonban magáért beszél, mert állításuk szerint már felveszi a versenyt olyan modellekkel, mint a több mint két évvel ezelőtt kiadott Meta Llama 1 és Llama 2 7B.

Ettől még nem fognak zavarba jönni

Az iparági versenyben ennyi késés persze az örökkévalóságot jelenti, de figyelembe kell venni, hogy egy minden szempontból szétosztott csapatról beszélünk, nem pedig egy dollármilliárdokból működő nagyvállalati egységről. Annyi így is kiderült, hogy az etikus fejlesztés sem lenne annyira reménytelen dolog, mint ahogy azt a technológiai cégek hirdetik. Az OpenAI, a Google és a többiek ugyanis méltányos felhasználásra hivatkozva porszívózta fel a publikus webet, azt hangoztatva, hogy lehetetlenné válna a generatív MI fejlesztése, ha nem használhatnának fel ingyenesen az ott elérhető tartalmat.

A Futurism riportja ehhez azért hozzáteszi azt is, hogy a jogszerű felhasználás sem szünteti meg a technológiával kapcsolatos összes etikai aggályt. A dolog alapvető kifutása továbbra is a munkahelyek megszüntetése marad, és a közkinccsé tett munkák szerzői sem feltétlenül arra gondoltak, hogy alkotásaikat for-profit MI-vállalkozások fogják újrahasznosítani. Abban a kutatók sem bíznak, hogy az etikus adatfelhasználás fogalma az MI-őrület nyomán nem alakul majd át, de reményeik szerint annyi talán kikényszeríthető lesz, hogy senki se rejthesse el, mit használ az egyes modellek betanításához.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Befektetőket riogató zombi unikornisok garázdálkodnak a Szilícium-völgyben

Az unikornis-listákon szereplő cégek egy jelentős része már csak egymilliárd dolláros értékelés alatt tudott tőkét bevonni – már ha tudott.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Befektetőket riogató zombi unikornisok garázdálkodnak a Szilícium-völgyben

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!