Az MI-k és a robotok már számos olyan területen képesek meghaladni az emberi teljesítményt, ahol valamilyen jól behatárolható feladatra kell koncentrálniuk. A sportok java része is éppen ilyen tevékenység, ebben a tekintetben tehát nem meglepő, hogy a gépek sorban döntögetik a tabukat. A mesterséges intelligencia a sakk, a gó, a póker és egy marék digitális játék után most újabb érdekes skalpot szerzett magának: dél-koreai kutatók olyan rendszert építettek, amelyik a válogatott játékosok szintjén képes curlingezni.
A jegyzőkönyv kedvéért emlékezzünk meg róla, hogy a curling a téli olimpia programjában is szereplő csapatjáték, amelynek során a jégen köveket próbálnak egy kör alakú mezőbe csúsztatni, minél közelebb a kör középpontjához. Ennek során lehetőség van az ellenfél köveinek blokkolására vagy kiütésére, és a saját kövek kedvezőbb pozícióba koccintására is. A játékszer csúszását a csapattagok a jég söprésével igyekeznek befolyásolni, anélkül, hogy magához a kőhöz hozzáérnének.
A való világban más dolog játszani
Minderre képes a szöuli Korea Egyetem kutatóinak a Berlini Műszaki Egyetemmel együttműködésben fejlesztett, Curly nevű robotja, ami tulajdonképpen egy érdekes kísérlet a mesterséges intelligencia és egy való életből vett, magas bizonytalanságú helyzet interakciójának vizsgálatára. Más szóval, a robotnak nem csak értelmeznie kell tudni a fizikai környezet eseményeit, hanem azoknak megfelelően cselekednie is kell, méghozzá valamilyen precíz stratégiai szemlélethez igazodva.
A Curly robotok nem önmagukban, hanem párban játszanak, ahol azonban mindkettő képes elvégezni a két szükséges feladat valamelyikét. Az egyik egység a pálya végénél állva folyamatosan vizsgálja a korábban odacsúsztatott kövek helyzetét az ott elhelyezkedő gyűrűkben, míg a másik Curly a pálya másik végénél a kövek dobását végzi. A páros ráadsául nem is használ söprűt, de így is olyan magas szinten képes irányítani a köveket, hogy a kísérletek során legyőzte például az egyik legmagasabban jegyzett koreai női csapatot.
A Science Robotics hasábjain a múlt héten megjelentetett publikációjukban a Curly fejlesztői nem csak azért nevezik jelentős eredménynek a robot teljesítményét, mert a gépek újabb sportágban veszik fel sikeresen a versenyt az emberekkel, hanem mert ez a bizonyos sportág valós időben, a valódi világban igényel dinamikus érzékelést és döntéshozatalt. Vagyis az adott helyzetek nem oldhatók meg úgy, hogy újra és újra egyre hatékonyabban tanítják be a rendszert, mivel ezek a felállások szinte megismételhetetlenek.
Söprű nélkül már ugyanolyan jók
A Curly esetében is a mély megerősítő tanulás (deep reinforcement learning, DRL) megközelítést alkalmazták, ami kifejezetten adat- és számításigényes módszer, de lehetővé teszi az MI emberi beavatkozás nélküli öntanulását – korábban ez tette lehetővé azt is, hogy a gépek a gójátékban vagy a Starcraftban és a Dota 2 játékokban is legyőzzék az emberi bajnokokat. Ahogy a kutatók a most közzétett anyagban is kifejtik, a Curly olyan adaptív akciókat hajt végre, amelyek a környezet gyors változásaira reagálnak, ez utóbbiak ugyanis látványos hatással lennének a renszer teljesítményére, ha a kompenzásió nem lenne folyamatos és megfelelő mértékű.
A Curly tervezésekor a környezeti tényezők (hőmérséklet, páratartalom, súrlódás) mellett olyan belső faktorokat is figyelembe vettek, mint hogy a robot mennyire pontosan tudja végrehajtani az egyes parancsokat, ezen felül természetesen számításba kell venni a játéktér pozicióinak alakulását. A rendszer része egy olyan MI modell, ami kidolgozza a megfelelő sratégiát (vagyis azt, hogy hová kellene célozni a kövekke), egy másik, adaptációs DLR modell pedig a körülmények változásához igazítja a megadott stratégiát.
A robotok dobásainak távolságokra vetített pontossága nagyjából megfelel annak, ahogy a 2018-as téli paralimpián résztvevő kerekesszékes nemzeti csapatok teljesítettek (lásd a második videón). Ez a szint elmarad az abszolút csúcsteljesítményektől, azonban érdemes figyelembe venni, hogy azokhoz söprést is használnak, szemben a Curly robotokkal és a kerekesszékes olimpikonokkal.
Azt a kutatók is elismerik, hogy egyelőre az embereknek kellene valamivel jobb teljesítményt nyújtaniuk, és hogy mégsem teszik, abban valószínűleg benne van az idegesség vagy éppen hogy a robot ellenfelek félvállról vétele. Ezzel együtt a stratégiai MI-modul összességében hatékonyabbnak tűnik az emberi tervezésnél, egész egyszerűen azért, mert mindig több tényezőt vesz egyszerre figyelembe. A Curly megalkotói mindenesetre azt remélik, hogy kutatásaikkal hozzájárulnak a valós idejű visszacsatolásokat alkalmazó egyéb rendszerek fejlesztéséhez is.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak