A mesterséges intelligencia feljődésében az egyik legfontosabb cél az olyan rendszerek létrehozása, amelyek lehetővé tennék a különböző robotoknak, hogy azok értelmes interakciót folytathassanak a környezetükkel, vagyis ne legyenek korlátozva az előre beprogramozott mozdulatsorok és feladatok elvégzésére. Ebben az irányban lehet egy apró lépés a Stanford Egyetem és a Facebook kutatói által megalkotott keretrendszer, ami a különféle alapvető cselekvéseket (például húzás, tolás) meghatározó információt gyűjti össze és teszi alkalmassá az MI-modellek tanítására.
Ez azt jelenti, hogy a szóban forgó modellek képessé válhatnak az olyan folyamatok kimenetelének előrejelzésére, mint hogy mondjuk egy fogantyút a megfelelő módon meghúzva ki lehet nyitni a hozzá tartozó ajtót. Ez tulajdonképpen annak a nagyon alacsony szintű leképzése, ahogy az emberek maguk is gondolkodnak és kölcsönhatásra lépnek az őket körülvevő ezernyi tárggyal: öntdatlanul is feltérképezzük, hogy mi mire való, milyen intarakcióra lesz szükség az adott hatások kiváltásához, és a testünket hogyan kell igazítanunk, hogy mindezt képesek legyünk végrehajtani.
Az emberek ennek megfelelően intuitív módon döntik el, hogy milyen akció fog működni, és mi az, ami nem fog működni. A kutatók ennek modellezésére minden hosszabb cselekvést elemi szintű interakciókra próbálnak meg felbontani, amit a robotok is gond nélkül végrehajthatnak egymás után, a kiszemelt tárgyak aktuális helyzetének a függvényében. Ezeket az interakciókat még tovább osztályozzák a "hol" és a "hogyan" szempontok szerint: a robotnak fel kell mérnie, hogy egy fiók kinyitásához melyik fogantyút kell meghúzni, és ezt a fogantyúra nézve merőleges vagy párhuzamos irányban érdemes-e megpróbálnia.
Apránként gyűlnek a tapasztalatok
Az eddigi megfigyelések azt is lehetővé teszik, hogy a feladatok végrehajtásának predikcióit vizuálisan is megjelenítsék. A beszámolóban szereplő modellben az objektumokról késztett képekről a színek és a mélység alapján egyfajta hőtérképet lehet készíteni, amelyen minden egyes ponthoz hozzárendelnek valamilyen "kivitelezhetőségi értéket" a javasolt akciók meghatározásával és a sikerre való esélyek számszerűsítésével együtt. Ebben a megközeltésben az ágensek úgy tanulhatják meg az egyszerűbb interakciók végrehajtását, hogy minden megmozdulásukat pontosan felcímkézhetik, mennyire voltak sikeresek a kívánatos változások előidézésében.
forrás: arxiv.org
Mindez elméletben már igazolható módon is hozzásegíti a mesterséges intelligenciát ahhoz, hogy az általukirányított robotok az addig ismeretlen, a létező kategóriákba nem besorolható tárgyakkal is hatékony kölcsönhatásra lépjenek. A tudósok a SAPIEN nevű szimulátort alkalmazták hatféle elemi cselekvés kidolgozására, amit 972 darab, összesen 15 kategóriába rendezett beltéri objektumon próbáltak végig. A kísérletekben a fenti predikciókat és valószínűségi értékeket 3D-s képek formájában, nyílt adatkészletekben is rögzítették.
Leírásuk szerint a most kidolgozott modell egyrészt arra ad lehetőséget, hogy taníthatók legyenek a különböző geometriai formákhoz kapcsolódó tulajdonságok, másrészt az is jól meghatározható legyen, hogy azok mennyire praktikusak az egyes akciók végrehajtására. Egy fiók esetében például kézenfekvő a fogantyúnál fogva meghúzni az egész szerkezetet, míg a fiókok betolásánál tulajdonképpen a teljes lapos felület ugyanannyira megfelelő lehet a nyomás kifejtésére, és itt a fogantyú éppen hogy a legmagasabb kockázatot hordozza abban a tekintetben, hogy a robot nem fog könnyen elboldogulni vele.
Azt maguk a szakemberek is hangsúlyozzák, hogy a fejlesztésnek pillanatnyilag jól meghatározott korlátai vannak. A modellt csak egyes képkockákkal lehet etetni, vagyis az input még nem lehet mozgó kép, ami egyelőre lehetetlenné teszi a mozgásban lévő objektumok vagy akatrészek kezelését. Ezen felül a rendszer még csak az előre kódolt pályagörbék alkalmazására van korlátozva – a jövőben éppen ennek feloldásán dolgoznak majd, hogy célkitűzésük szerint megalkossanak egy generalizált, a kötetlen formájú inteakciót is lehetővé tévő modellt.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak