A mesterséges intelligenciának az emberi munka automatizálását érintő képességei miatt aktuális lenne, hogy szabványosított, empirikus módszerekkel vizsgáljuk az MI-automatizálás fejlődését és a technológia munkaerőre gyakorolt hatás. A valós gazdasági tevékenységen alapuló, megbízható mérőszámok nélkül ugyanis nehéz lesz kezelni a dolgot: bár az MI-rendszerek gyors fejlődést mutatnak számos referenciaértéket illetően, az továbbra sem világos, hogyan fordíthatók le ezek az eredmények a gazdaságilag értékes munka elvégzésére – olvasható a nonprofit Center for AI Safety (CAIS) és a Scale AI munkatársai által közzétett kutatásban.
Ahogy írják, a szóban forgó referenciaértékek olyan a speciális készségekben mérik a teljesítményt, mint a szoftverkódolás, más esetekben pedig az egyszerűbb, megosztott feladatokra összpontosítanak. Bár ezeket értékes visszajelzéseknek tartják, úgy ítélik meg, hogy önmagukban nem sok közük van a távmunka tágabb környezetében rejlő sokszínűséghez és összetettséghez, vagyis csak korlátozott betekintést nyújt az emberi munka automatizálásának fejlődésébe. A kutatók az általuk kidolgozott benchmark alapján hat fejlett MI-ügynököt teszteltek szimulált szabadúszó (távmunkás) feladatokkal, az eredmények pedig nem meglepő módon lesújtóak lettek.
Erről nem volt szó a nagy felhajtásban
Mint kiderült, egyetlen MI-ágens sem volt képes többet elvégezni a munka 3 százalékánál, így a lehetséges 143 991 dollárból csak1810 dollárt kerestek. A Remote Labor Index benchmark a valós projekteket használ a botok teljesítményének értékelésére olyan iparágakban, mint a játékfejlesztés és az adatelemzés, és eddig igazolta azokat a történeteket, amelyek szerint sok helyen kénytelenek felvenni az MI-vel helyettesített alkalmazottakat, amikor szembesülnek az új eszközök hatékony(talan)ságával. A legjobban teljesítő MI-ügynök is csak a feladatainak 2,5 százalékát tudta olyan szinten elvégezni, ami egy valódi megbízásos munka esetén elfogadható lenne.
A CAIS igazgatója a Wired magazin cikkében arról beszélt, hogy a terület gyors fejlődése ellenére bizonyos hibák makacsul meghatározzák a mesterségesintelligencia-ügynökök működését. Nincsen például hosszú távú memóriájuk, és így a tapasztalatokból sem tudnak folyamatosan tanulni, nem tudnak az emberekhez hasonlóan készségeket elsajátítani a munkavégzés során, mint az emberek. A Scale AI kutatási igazgatója szerint éve óta zajlik a vita az MI munkahelyi szerepéről, de jórészt csak hipotetikus vagy elméleti szinten: valójában úgy szüntetik meg az emberek által betöltött pozíciókat, hogy nem tudni, hova vezet az emberi tehetség hiánya.
Az MIT egy másik kutatásáról, amely szerint a túlzott elvárásokkal és a hibás integrációs megközelítések miatt elképesztő arányban fuccsolnak be az MI-projektek, itt írtunk részletesen »
Az ötlettől az értékteremtésig – az üzleti réteg szerepe az adattudományi működésben
Az adattudomány valódi értéke ott válik láthatóvá, ahol az előrejelzések döntésekké, a döntések pedig mérhető üzleti eredményekké alakulnak. Ehhez azonban tudatos üzleti beágyazásra, mérési keretrendszerekre és következetes visszacsatolásra is szükség van.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak