Az MIT tudósai azokat az adatkészleteket vették górcső alá, amelyeket előszeretettel használnak a mesterséges intelligencia trenírozására.

Miközben az IBM kutatói éppen a legjobb humán vitázót is leérvelő algoritmust simogatnak, kiderült, hogy egy csomó mesterséges intelligenciával foglalkozó projekt alapvetően félremegy azzal, hogy nem kellően pontos adatmintákból dolgoznak.

Alapvető probléma

Az MIT szakemberei az MI tesztelésére, trenirozására leggyakrabban használt adattömegeket vizsgálták meg. Ide olyan készletek tartoznak, amelyeket egyenként is minimum 100 ezer alkalommal vetettek be valamilyen fejlesztés során. Van köztük szöveges alapú, amely például az Amazon áruházából, vagy az IMDb oldaláról származik, de képek tengerét és hangfelvételek sokaságát is vizsgálták azok pontossága, megfelelő felcímkézése szerint.

Összességében 3,4 százaléknyi mintáról derült ki, hogy pontatlanul, vagy éppen teljesen rosszul van azonosítva az eredeti adattömegben. Ez értelemszerűen elég nagy arány ahhoz, hogy jelentősen befolyásolja az ezeken trenírozott algoritmusok eredményességét, pontosságát.

A hibák igen széles spektrumon mozogtak. Az Amazon termékértékeléseinél például pozitívnak lett megjelölve egy sor, egyértelműen negatív vélemény, és ugyanerre fordítva is bőven előfordult. A képek esetében említhető állatok félresikerült azonosítása, de olyan hibák is előfordultak, amikor egy képen nem a fő motívum, hanem egy jelentéktelen részlet lett címkeként rögzítve (egy kerékpárnál például a vázon tartott üditős flakont sikerült kiemelni). A legdurvább találat talán az a cumizó csecsemőt ábrázoló fotó volt, amelyet mellbimbóként sikerült kategorizálni.

 

Példák a félrecímkézett fotókra (forrás: MIT)

 

A szövegek és képek félreértelmezése után azon sincs mit csodálkozni, hogy a hangfelvételeket tartalmazó adatkészleteknél sem stimmelt minden. A YouTube anyagaiból származó csomagnál az egyik említett fiaskó az volt, hogy egy hosszabb beszédet egyszerűen templomi harangszónak azonosítottak (utóbbi egyébként tényleg hallható a felvételen, ám csak a végén és egy rövid ideig).   

Kóddal ellenőriztettek (nem hibátlanul)

Mivel hatalmas adattömegekről van szó, így értelemszerűen a kutatók nem tudták ezt a vizsgálatot önerőből elvégezni. Ehhez első körben egy az adatkészletekben meglévő irreleváns információkat kutató keretrendszert vetettek be. Az algoritmus által megjelölt vitás eseteket aztán kiadták bérmunkába az Amazon Mechanical Turk platformján, amelyen az ilyen jellegű egyszerű, de nagy mennyiségű feladatokra lehet jelentkezőket toborozni. 

Az eredmények összesítését követően kiderült, hogy a kód által előzetesen kigyűjtött elemek több mint fele valóban nem volt tökéletesen beazonosítva. A QuickDraw elnevezésű tesztkészlet lett a negatív bajnok azzal, hogy az adattömeg nagyjából tizede tekinthető rossznak.

Egyébként hiba és hiba között is komoly különbségek vannak, hiszen a rossznak minősített besorolások egy része inkább csak apró pontatlanságnak, vagy határesetnek tekinthető. Ráadásul gyakran akasztották a hóhért, hiszen a problémákat kutató algoritmusnak is sikerült mellényúlnia: egy esetben például egy teljesen pontosan felcímkézett, hangvillát ábrázoló fotóról azt hitte, hogy menóra van rajta, ezért a hibás csoportba utalta a mintát.

Akik egyébként szeretnének mazsolázni a fentebb említett hibákon túl is, azok mindenképpen látogassák meg a kutatók által erre a célra létrehozott honlapot.

Cloud & big data

A Waymo robotaxik legyőzhetetlen ellenfele: az iskolabusz

Még egy texasi iskolakörzet is megpróbált segíteni, hogy a Waymo járművei végre megtanulják szabályosan kikerülni a gyerekeket fel- és leszállító iskolabuszokat, de megint kiderült, hogy mennyire ellentmondásos az önvezető technológia alkalmazkodóképessége.
 
Nincs egy új, "alapértelmezett" platform a VMware mellett, helyett; az informatikai vezetők egy, a korábbinál jelentősen összetettebb döntési helyzetben találják magukat 2026-ban. Cikkünk arra a kérdésre keresi a választ, hogy milyen lehetőségek közül választhatnak a CIO-k.

a melléklet támogatója az EURO ONE

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.