Egyetemi kutatók a gyakorlatban is bemutatták, hogy a mesterséges intelligencia képzésében egyáltalán nem szükségszerű a szerzői jogok semmibevétele, és működik az átláthatóbb, bár kétségtelenül időigényesebb alternatíva a webes tartalmak engedély nélküli használatával szemben.

A Washington Post beszámolója szerint az MIT, a Cornell Egyetem, a Torontói Egyetem és más intézmények munkatársai betanítottak egy nagy nyelvi modellt (LLM-et) kizárólag nyílt forrású licenccel vagy közkincsként kezelt adatok felhasználásával. A feladat egyáltalán nem volt könnyű, hiszen nem a számítási teljesítmény, hanem az emberi erőforrások jelentették a szűk keresztmetszetet: a több tucat MI-kutatónak egy több mint nyolc terabájtos adathalmazt kellett manuálisan megtisztítania és újraformáznia, hogy a szöveget alkalmassá tegye a mesterséges intelligencia képzésére.

Ahogy a cikkből is kiderül, hihetetlen mennyiségű plusz munkát jelentett az adatok szerzői jogi státuszának ellenőrzése és újraellenőrzése, mivel sok online tartalom nincs megfelelően licencelve. Bár munkájuk során ők is automatizált eszközöket használtak, a manuális annotációt és az egyes személyek ellenőrzését nem úszhatták meg, mire elkészültek a 7 milliárd paraméterrel működő LLM betanításával. Az eredmény azonban magáért beszél, mert állításuk szerint már felveszi a versenyt olyan modellekkel, mint a több mint két évvel ezelőtt kiadott Meta Llama 1 és Llama 2 7B.

Ettől még nem fognak zavarba jönni

Az iparági versenyben ennyi késés persze az örökkévalóságot jelenti, de figyelembe kell venni, hogy egy minden szempontból szétosztott csapatról beszélünk, nem pedig egy dollármilliárdokból működő nagyvállalati egységről. Annyi így is kiderült, hogy az etikus fejlesztés sem lenne annyira reménytelen dolog, mint ahogy azt a technológiai cégek hirdetik. Az OpenAI, a Google és a többiek ugyanis méltányos felhasználásra hivatkozva porszívózta fel a publikus webet, azt hangoztatva, hogy lehetetlenné válna a generatív MI fejlesztése, ha nem használhatnának fel ingyenesen az ott elérhető tartalmat.

A Futurism riportja ehhez azért hozzáteszi azt is, hogy a jogszerű felhasználás sem szünteti meg a technológiával kapcsolatos összes etikai aggályt. A dolog alapvető kifutása továbbra is a munkahelyek megszüntetése marad, és a közkinccsé tett munkák szerzői sem feltétlenül arra gondoltak, hogy alkotásaikat for-profit MI-vállalkozások fogják újrahasznosítani. Abban a kutatók sem bíznak, hogy az etikus adatfelhasználás fogalma az MI-őrület nyomán nem alakul majd át, de reményeik szerint annyi talán kikényszeríthető lesz, hogy senki se rejthesse el, mit használ az egyes modellek betanításához.

Cloud & big data

Elon Musk a bíróság szerint is kavart a Twitter felvásárlásakor

A részvényesek több milliárd dolláros kártérítésre számítanak, Musk ügyvédei szerint az első fokú ítélet csak egy bukkanó a győzelem felé vezető úton.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.