A természetes nyelvek feldolgozása vagy az élethű arcképek összeállítása mellett az Open AI-nál azt is megoldják, hogy az MI emberi felhasználókat figyelve sajátítson el kifejezetten bonyolult műveleteket.

Az Open AI sikeresen betanított egy neurális hálózatot, hogy a videós előképzésnek (video pretraining, VPT) nevezett módszer segítségével úgy váljon képessé a Minecrafttel játszani, hogy azt legnagyobb részt az emberi játékosok tevékenységéről szóló óriási, felcímkézetlen adatkészlet feldolgozásával sajátította el. A rendszer tanítására használt, több tízezer órányi Youtube-os videónak ugyanis csak a töredékét, kétezer órányi anyagot készítették elő ilyen módon, annak alapján pedig egy másik MI címkézte fel a többi videósa anyag oroszlánrészét.

A VPT ennek alapján új távlatokat nyithat az interneten elérhető, praktikusan végtelen mennyiségű, de címkézetlen videós adattömeg hasznosításában egy egyszerű, félig felügyelt imitációs tanulási módszer formájában. A kutatók először egy kis adatkészletet gyűjtenek be az arra vállalkozóktól, ahol a Minecraft kapcsán nem csak a játékról készült felvételeket, de a játékosok műveleteit, billentyűleütéseit vagy egérmozgásait is rögzítik. Ezekkel aztán betanítanak egy olyan inverz dinamikai modellt (inverse dynamics model, IDM), amelyik megjósolja a videó egyes lépéseinél végrehajtott műveleteket.

Az IDM ennek során a múltbeli és jövőbeli információkat is felhasználhatja, hogy egyre pontosabb előrejelzéseket adjon, és az Open AI szerint ez egy sokkal egyszerűbb és sokkal kevesebb adatot igénylő eljárás, mint ha az úgynevezett "behavioral cloning" módszer során a programnak egy nagy csomó korábbi képkocka alapján kellene felismernie és reprodukálnia bizonyos emberi, szubkognitív képességeket. (A nyelvi modellek és a GPT-3 esetében az itt alkalmazott "akciócímkék" a mondatban soron következő szónak felelnének meg, de a Minecraft esetében nyilván teljesen másról van szó.)

Szintlépés az akciócímkékkel

A megfelelően kiképzett IDM segítségével az online videók óriási adathalmazát lehet automatikusan felcímkézni és alkalmazni a rendszerek tanítására. Az Open AI azt reméli, hogy a VPT kikövezi majd az utat az olyan önálló ágensekhez, amelyek az interneten található videók nézegetésévl tanulnak meg egyre összetettebb cselekvéseket. A VPT más módszerekhez képest is izgalmas lehetőséget kínálhat a nyelvi feldolgozáson tú egy sor másik területen: bár a mostani kísérletek a Minecraftre koncentráltak, a modell abban képes volt magától megtanulni egy, az emberek számára több mint 20 percet és sok ezer műveletet igénylő feladat végrehajtását, amihez hasonló eredményt korábban mág nem igazán sikerült elérni.

Mivel maga a Minecraft egy kifejezetten nyílt végű játék, és a natív emberi felhasználói felület (az egér és a billentyűzet) is általános dolognak számít, a kutatók szerint az ilyen programok nagy potenciállal rendelkeznek például a számítógép-használatban. A rendszerek finomhangolására persze a továbbiakban is szükség lesz valamilyen dedikált adathalmazokkal, de ezek csak arra szolgálnak, hogy egyre megbízhatóbbá tegyék a modellek működését. A lényeg, hogy az Open AI szoftvere már nem csak az egyes történések, hanem az azokhoz vezető emberi tevékenység megfigyelésével sajátítja el a különféle tevékenységeket.

Cloud & big data

CIO Hungary 2025: aki felkészül, az győz?

Beszámolónk második része a 16. CIO Hungary konferencia első napjáról, benne az elmaradhatatlan biztonsági panellel, amit természetesen már a mesterséges intelligencia is tematizált.
 
Hirdetés

Digitalizáció a mindennapokban: hogyan lesz a stratégiai célból napi működés?

A digitális transzformáció sok vállalatnál már nem cél, hanem elvárás – mégis gyakran megreked a tervezőasztalon. A vezetői szinten megfogalmazott ambiciózus tervek nehezen fordulnak át napi működéssé, ha hiányzik a technológiai rugalmasság vagy a belső kohézió.

Azok a vállalatok, amelyek gyorsabban, intelligensebben és empatikusabban tudnak reagálni ügyfeleik kérdéseire, összességében értékesebb, hosszabb távú kapcsolatokat építhetnek ki.

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.