Nem jövőre nyernek BL-t a robotfocisták

Bitport2023.05.09.Piaci hírek

A DeepMind kutatói által betanított gépi játékosok tudatmódosult bölcsödéseket idézve esnek-kelnek a pályán, de tudományos szempontból ez is előrelépés.

Az Alphabeten belül nemrégiben egy nagy csapat alá terelt DeepMind szakértői érdekes, egyben rendkívül szórakoztató videót tettek közzé nemrégiben arról, milyen szinten sikerült mélytanulásos módszer segítségével két robotot megtanítani a kispályás foci egy leegyszerűsített verziójára.

Az alábbi bemutatóban több rövid, egyetlen gólig tartó összecsapást rögzítettek a kutatók. Az néhány másodperc után világossá válik, hogy ezek a gépek nem rendelkeznek a Boston Dynamics akrobatikus képességekkel menőző robotjainak kecsességével. Ennek ellenére a DeepMind kutatási projektjét sem érdemes lebecsülni, mivel a két csapat más megközelítéssel igyekszik előmozdítani a robotika lehetőségeit.

A Robotis OP3 elnevezésű emberszerű robotok egy 5x4 méteres, rámpákkal határolt pályán próbálják kicselezni a másikat. Utóbbit nem érdemes szó szerint venni, mert a szerkezeteknek a mozgás közbeni talpon maradás sem triviális feladat, tehát sarkazásokat és biciklicseleket ne várjunk el tőlük.

A robotok a bemutató során többször "lefagynak", és ebből az állapotból csak a térérzékelést segítő pöttyökkel ellátott labda megpöckölésével tudja kizökkenteni őket az emberi segítő. Az viszont a javukra írandó, hogy ugyan folyamatosan esnek-kelnek, ám villámgyorsan képesek újra álló pozícióba helyezni magukat. Sőt, néha egészen szakszerű védekezés nyomait is fel lehet fedezni a többnyire csak koordinálatlan kisgyerekek produkcióját idéző jelenetek között.

Nem elég csak a kapura fókuszálni

A 28 kutató együttes munkáját összefoglaló tanulmány (PDF) szerint a 20 különböző izülettel rendelkező humanoid gépeket irányító algoritmus tanítása során nem kizárólag a futball "végső értelmére", azaz a gólszerzésre kellett koncentrálni. A hatékony focihoz ugyanis sok különböző készség együttes elsajátítására van szükség.

A neurális hálózatnak ezért első körben az egyes készségeket (járás, felállás, rúgás, fordulás, helyezkedés stb.) külön-külön kellett elsajátítania. A mélytanulásos módszer lényege, hogy az algoitmus megkapja az elérendő célokat, amelyeket próbálkozások tömegén keresztül tanul meg minél hatékonyabban elérni.

A munka olyan érdekes elemeket is előhozott, mint a gólszerzés büntetése. A rendszer ugyanis hajlamos volt földön fekve is kizárólag a kapura koncentrálni, ami azt eredményezte, hogy a robotok gurulással igyekeztek célba juttatni a labdát. A felállás külön "jutalmazásával" viszont sikerült korrigálni a futballpályákhoz méltatlan viselkedést.

Mindez a tanulási folyamat virtuális környezetben zajlott. A megtanult készségek fizikai térbe történő átültetése pedig meglehetősen könnyen ment. A rendszer elemeinek azonosításával és a szabályok szükségszerű finomításával a szoftver ugyanúgy képes volt hozni a szintet a valóságos pályán is. Az egyik ilyen módosítás például külön díjazta azt, ha a szoftver nem terheli feleslegesen a robot térdízületét. Ennek hiányában ugyanis gyorsan leamortizálódtak a gépesített sporttársak.

A kutatást végző csapat szerint méréseikkel sikerült bizonyítani, hogy a megerősítésen alapuló tanítási folyamat gyorsabb és jobb eredményeket hoz, mint ha mindezt direkt programozással próbálták volna elérni.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Piaci hírek

Már az idén elérhetővé válhat az Amazon műholdas internete

A Starlink versenytársának szánt Leo közel 400 műholddal rendelkezik, és nemsokára beindítaná publikus szolgáltatását a megfelelő földrajzi területeken.

A hónap témája

Túl a költségcsökkentésen - felnőtt a felhő

A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Már az idén elérhetővé válhat az Amazon műholdas internete

Túl a költségcsökkentésen - felnőtt a felhő

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!