Egyetemi kutatók a gyakorlatban is bemutatták, hogy a mesterséges intelligencia képzésében egyáltalán nem szükségszerű a szerzői jogok semmibevétele, és működik az átláthatóbb, bár kétségtelenül időigényesebb alternatíva a webes tartalmak engedély nélküli használatával szemben.

A Washington Post beszámolója szerint az MIT, a Cornell Egyetem, a Torontói Egyetem és más intézmények munkatársai betanítottak egy nagy nyelvi modellt (LLM-et) kizárólag nyílt forrású licenccel vagy közkincsként kezelt adatok felhasználásával. A feladat egyáltalán nem volt könnyű, hiszen nem a számítási teljesítmény, hanem az emberi erőforrások jelentették a szűk keresztmetszetet: a több tucat MI-kutatónak egy több mint nyolc terabájtos adathalmazt kellett manuálisan megtisztítania és újraformáznia, hogy a szöveget alkalmassá tegye a mesterséges intelligencia képzésére.

Ahogy a cikkből is kiderül, hihetetlen mennyiségű plusz munkát jelentett az adatok szerzői jogi státuszának ellenőrzése és újraellenőrzése, mivel sok online tartalom nincs megfelelően licencelve. Bár munkájuk során ők is automatizált eszközöket használtak, a manuális annotációt és az egyes személyek ellenőrzését nem úszhatták meg, mire elkészültek a 7 milliárd paraméterrel működő LLM betanításával. Az eredmény azonban magáért beszél, mert állításuk szerint már felveszi a versenyt olyan modellekkel, mint a több mint két évvel ezelőtt kiadott Meta Llama 1 és Llama 2 7B.

Ettől még nem fognak zavarba jönni

Az iparági versenyben ennyi késés persze az örökkévalóságot jelenti, de figyelembe kell venni, hogy egy minden szempontból szétosztott csapatról beszélünk, nem pedig egy dollármilliárdokból működő nagyvállalati egységről. Annyi így is kiderült, hogy az etikus fejlesztés sem lenne annyira reménytelen dolog, mint ahogy azt a technológiai cégek hirdetik. Az OpenAI, a Google és a többiek ugyanis méltányos felhasználásra hivatkozva porszívózta fel a publikus webet, azt hangoztatva, hogy lehetetlenné válna a generatív MI fejlesztése, ha nem használhatnának fel ingyenesen az ott elérhető tartalmat.

A Futurism riportja ehhez azért hozzáteszi azt is, hogy a jogszerű felhasználás sem szünteti meg a technológiával kapcsolatos összes etikai aggályt. A dolog alapvető kifutása továbbra is a munkahelyek megszüntetése marad, és a közkinccsé tett munkák szerzői sem feltétlenül arra gondoltak, hogy alkotásaikat for-profit MI-vállalkozások fogják újrahasznosítani. Abban a kutatók sem bíznak, hogy az etikus adatfelhasználás fogalma az MI-őrület nyomán nem alakul majd át, de reményeik szerint annyi talán kikényszeríthető lesz, hogy senki se rejthesse el, mit használ az egyes modellek betanításához.

Cloud & big data

A Nemzeti Gárdát is be kell vetni Minnesotában egy kibertámadás miatt

Az amerikai tagállam közigazgatási központját múlt hét végén érte olyan súlyos online támadás, ami miatt jelenleg is több fennakadás van a Saint Paul önkormányzata által üzemeltetett rendszerekben.
 
A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.