A természetes nyelvek feldolgozása vagy az élethű arcképek összeállítása mellett az Open AI-nál azt is megoldják, hogy az MI emberi felhasználókat figyelve sajátítson el kifejezetten bonyolult műveleteket.
Hirdetés
 

Az Open AI sikeresen betanított egy neurális hálózatot, hogy a videós előképzésnek (video pretraining, VPT) nevezett módszer segítségével úgy váljon képessé a Minecrafttel játszani, hogy azt legnagyobb részt az emberi játékosok tevékenységéről szóló óriási, felcímkézetlen adatkészlet feldolgozásával sajátította el. A rendszer tanítására használt, több tízezer órányi Youtube-os videónak ugyanis csak a töredékét, kétezer órányi anyagot készítették elő ilyen módon, annak alapján pedig egy másik MI címkézte fel a többi videósa anyag oroszlánrészét.

A VPT ennek alapján új távlatokat nyithat az interneten elérhető, praktikusan végtelen mennyiségű, de címkézetlen videós adattömeg hasznosításában egy egyszerű, félig felügyelt imitációs tanulási módszer formájában. A kutatók először egy kis adatkészletet gyűjtenek be az arra vállalkozóktól, ahol a Minecraft kapcsán nem csak a játékról készült felvételeket, de a játékosok műveleteit, billentyűleütéseit vagy egérmozgásait is rögzítik. Ezekkel aztán betanítanak egy olyan inverz dinamikai modellt (inverse dynamics model, IDM), amelyik megjósolja a videó egyes lépéseinél végrehajtott műveleteket.

Az IDM ennek során a múltbeli és jövőbeli információkat is felhasználhatja, hogy egyre pontosabb előrejelzéseket adjon, és az Open AI szerint ez egy sokkal egyszerűbb és sokkal kevesebb adatot igénylő eljárás, mint ha az úgynevezett "behavioral cloning" módszer során a programnak egy nagy csomó korábbi képkocka alapján kellene felismernie és reprodukálnia bizonyos emberi, szubkognitív képességeket. (A nyelvi modellek és a GPT-3 esetében az itt alkalmazott "akciócímkék" a mondatban soron következő szónak felelnének meg, de a Minecraft esetében nyilván teljesen másról van szó.)

Szintlépés az akciócímkékkel

A megfelelően kiképzett IDM segítségével az online videók óriási adathalmazát lehet automatikusan felcímkézni és alkalmazni a rendszerek tanítására. Az Open AI azt reméli, hogy a VPT kikövezi majd az utat az olyan önálló ágensekhez, amelyek az interneten található videók nézegetésévl tanulnak meg egyre összetettebb cselekvéseket. A VPT más módszerekhez képest is izgalmas lehetőséget kínálhat a nyelvi feldolgozáson tú egy sor másik területen: bár a mostani kísérletek a Minecraftre koncentráltak, a modell abban képes volt magától megtanulni egy, az emberek számára több mint 20 percet és sok ezer műveletet igénylő feladat végrehajtását, amihez hasonló eredményt korábban mág nem igazán sikerült elérni.

Mivel maga a Minecraft egy kifejezetten nyílt végű játék, és a natív emberi felhasználói felület (az egér és a billentyűzet) is általános dolognak számít, a kutatók szerint az ilyen programok nagy potenciállal rendelkeznek például a számítógép-használatban. A rendszerek finomhangolására persze a továbbiakban is szükség lesz valamilyen dedikált adathalmazokkal, de ezek csak arra szolgálnak, hogy egyre megbízhatóbbá tegyék a modellek működését. A lényeg, hogy az Open AI szoftvere már nem csak az egyes történések, hanem az azokhoz vezető emberi tevékenység megfigyelésével sajátítja el a különféle tevékenységeket.

Cloud & big data

Máris megszűnik a ChatGPT automata modellválasztója az ingyenes felhasználásban

Nemcsak drága, hanem az OpenAi szerint nem is népszerű, így a bonyolultabb kérdésekre adott pontosabb válaszokhoz ismét manuális modellválasztásra lesz szükség.
 
Hirdetés

Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai

Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.

Sok szervezet adatvezéreltnek tartja magát, mert van BI rendszere és heti dashboardja. A valóságban azonban ennél többről van szó; a kérdés ugyanis nem az, hogy van-e elég adat, hanem, hogy mennyire jól használják a döntések meghozatalához.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.