Ez az MI kitalálja, mire valók a körülötte lévő tárgyak

Bitport2021.01.11.Cloud & big data

Egyelőre csak olyasmiről van szó, mint egy mosógép ajtajának a nyitása és bezárása, de már dolgoznak a sokkal bonyolultabb, szabad interakció megvalósításán is.

A mesterséges intelligencia feljődésében az egyik legfontosabb cél az olyan rendszerek létrehozása, amelyek lehetővé tennék a különböző robotoknak, hogy azok értelmes interakciót folytathassanak a környezetükkel, vagyis ne legyenek korlátozva az előre beprogramozott mozdulatsorok és feladatok elvégzésére. Ebben az irányban lehet egy apró lépés a Stanford Egyetem és a Facebook kutatói által megalkotott keretrendszer, ami a különféle alapvető cselekvéseket (például húzás, tolás) meghatározó információt gyűjti össze és teszi alkalmassá az MI-modellek tanítására.

Ez azt jelenti, hogy a szóban forgó modellek képessé válhatnak az olyan folyamatok kimenetelének előrejelzésére, mint hogy mondjuk egy fogantyút a megfelelő módon meghúzva ki lehet nyitni a hozzá tartozó ajtót. Ez tulajdonképpen annak a nagyon alacsony szintű leképzése, ahogy az emberek maguk is gondolkodnak és kölcsönhatásra lépnek az őket körülvevő ezernyi tárggyal: öntdatlanul is feltérképezzük, hogy mi mire való, milyen intarakcióra lesz szükség az adott hatások kiváltásához, és a testünket hogyan kell igazítanunk, hogy mindezt képesek legyünk végrehajtani.

Az emberek ennek megfelelően intuitív módon döntik el, hogy milyen akció fog működni, és mi az, ami nem fog működni. A kutatók ennek modellezésére minden hosszabb cselekvést elemi szintű interakciókra próbálnak meg felbontani, amit a robotok is gond nélkül végrehajthatnak egymás után, a kiszemelt tárgyak aktuális helyzetének a függvényében. Ezeket az interakciókat még tovább osztályozzák a "hol" és a "hogyan" szempontok szerint: a robotnak fel kell mérnie, hogy egy fiók kinyitásához melyik fogantyút kell meghúzni, és ezt a fogantyúra nézve merőleges vagy párhuzamos irányban érdemes-e megpróbálnia.

Apránként gyűlnek a tapasztalatok

Az eddigi megfigyelések azt is lehetővé teszik, hogy a feladatok végrehajtásának predikcióit vizuálisan is megjelenítsék. A beszámolóban szereplő modellben az objektumokról késztett képekről a színek és a mélység alapján egyfajta hőtérképet lehet készíteni, amelyen minden egyes ponthoz hozzárendelnek valamilyen "kivitelezhetőségi értéket" a javasolt akciók meghatározásával és a sikerre való esélyek számszerűsítésével együtt. Ebben a megközeltésben az ágensek úgy tanulhatják meg az egyszerűbb interakciók végrehajtását, hogy minden megmozdulásukat pontosan felcímkézhetik, mennyire voltak sikeresek a kívánatos változások előidézésében.

forrás: arxiv.org

Mindez elméletben már igazolható módon is hozzásegíti a mesterséges intelligenciát ahhoz, hogy az általukirányított robotok az addig ismeretlen, a létező kategóriákba nem besorolható tárgyakkal is hatékony kölcsönhatásra lépjenek. A tudósok a SAPIEN nevű szimulátort alkalmazták hatféle elemi cselekvés kidolgozására, amit 972 darab, összesen 15 kategóriába rendezett beltéri objektumon próbáltak végig. A kísérletekben a fenti predikciókat és valószínűségi értékeket 3D-s képek formájában, nyílt adatkészletekben is rögzítették.

Leírásuk szerint a most kidolgozott modell egyrészt arra ad lehetőséget, hogy taníthatók legyenek a különböző geometriai formákhoz kapcsolódó tulajdonságok, másrészt az is jól meghatározható legyen, hogy azok mennyire praktikusak az egyes akciók végrehajtására. Egy fiók esetében például kézenfekvő a fogantyúnál fogva meghúzni az egész szerkezetet, míg a fiókok betolásánál tulajdonképpen a teljes lapos felület ugyanannyira megfelelő lehet a nyomás kifejtésére, és itt a fogantyú éppen hogy a legmagasabb kockázatot hordozza abban a tekintetben, hogy a robot nem fog könnyen elboldogulni vele.

Azt maguk a szakemberek is hangsúlyozzák, hogy a fejlesztésnek pillanatnyilag jól meghatározott korlátai vannak. A modellt csak egyes képkockákkal lehet etetni, vagyis az input még nem lehet mozgó kép, ami egyelőre lehetetlenné teszi a mozgásban lévő objektumok vagy akatrészek kezelését. Ezen felül a rendszer még csak az előre kódolt pályagörbék alkalmazására van korlátozva – a jövőben éppen ennek feloldásán dolgoznak majd, hogy célkitűzésük szerint megalkossanak egy generalizált, a kötetlen formájú inteakciót is lehetővé tévő modellt.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

CIO Hungary Tavasz 2026: az MI nem lehetőség, hanem kötelező elem

Mit jelent majd a vállalati informatika tíz év múlva? Milyen szakemberekre és milyen informatikai vezetőkre lesz szükség hozzá? Lehet, hogy a mesterséges intelligencia mindannyiunk munkáját elvégzi? Beszámolónk első része a CIO Hungary Tavasz konferencia első napjáról.

Hirdetés

Költségcsökkenésből finanszírozott modernizáció

A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.

A hónap témája

Az automatizáció új modellje: előfizetéses robotok és MI

A szolgáltatásként kínált mesterséges intelligencia és robotizált folyamatautomatizálási megoldások leegyszerűsítik a bevezetést, miközben új kockázatokat is hoznak.

a melléklet támogatója a ONE Solutions

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

CIO Hungary Tavasz 2026: az MI nem lehetőség, hanem kötelező elem

Az automatizáció új modellje: előfizetéses robotok és MI

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!