A DeepMind MuZero nevű új modellje már a gó, a sakk vagy a sógi szabályait is bármilyen segítség nélkül, saját maga tanulja meg, ami rengeteg gyakorlati MI-alkalmazásban lehet majd nagyon hasznos képesség.

Már több int három és fél éve, hogy az Alphabet DeepMind részlege által fejlesztett AlphaGo mesterséges intelligencia legyőzte a világ egyik legerősebb gójátékosát. A dél-koreai I Szedol a legfrissebb hírek szerint éppen ezzel indokolta visszavonulását a professzionális versenyzéstől: a Jonhap hírügynökségnek nyilatkozva kifejtette, hogy az MI legyőzhetetlen, és erre ma már akkor sem lehet képes senki, ha máskülönben hatalmas erőfeszítések árán a legmagasabban jegyzett emberi játékossá válik.

Az AlphaGo 2016-os sikere fontos lépcső volt a mesterséges intelligencia fejlődésében, mivel a gójátékban nem lehet ilyen sikereket elérni pusztán a számítógépek gyorsan növkvő számítási kapacitására alapozva. Ahogy akkor is írtuk, a DeepMind megközelítése újdonságnak számított a rendszer ideghálót modellező felépítése és a sztochasztikus keresés kombinációjával.

A DeepMind 2017-ben már azzal került be a hírekbe, hogy az AlphaGo AlphaZero nevű változata 100-0 arányban verte meg a rendszer korábbi, a dél-koreai profi versenyzőt is legyőző verzióját. Ez ráadásul úgy sikerült neki, hogy mindössze három nappal azelőtt kezdték megtanítani a játékra, és a tanulás során csak saját csak a maga elleni, kezdetben még véletlenszerű gyakorló mérkőzéseket játszott.

Tavaly a Science magazinban közölték, hogy az AlphaZero a gó, a sakk és a japán sakknak is nevezett sógi önálló betanulására is képes, minden esetben úgy, hogy a rövid folyamat végén gond nélkül képes megverni a legjobb emberi játékosokat. Néhány napja pedig beszámoltak a MuZero nevű modell eredményeiről is, amely annyiben jelent újabb előrelépést, hogy a játékok szabályokat is egyedül tanulja meg, és rövid idő után így hozza az AlphaZero teljesítményével megegyező szintet.

A kutatók szerint a látszólag apró lépésnek nagyon nagy jelentősége van, amennyiben a most alkalmazott megoldások előkészítenek egy nagy csomó sokkal konkrétabb, a való világban is bevethető MI-felhasználást. Ez azokban az esetekben érdekes, amikor nincslehetőség szimulációk futtatására, hogy azokon keresztül kommunikálják a megfelelő szabályokat és az adott környezetek dinamikáját.

Az eddigi tervező algoritmusok ugyanis, akármilyen hatékonyak, úgy értek el sikereket, hogy lészen kaptak valamilyen meglévő tudásanyagot – ha mást nem, az adott játékok szabályait vagy valamilyen pontos szimulációt.A MuZero ezzel szemben maga végez megfigyeléseket (például az Atari gójátékának állásairól készült képernyőképeket), és ezek alapján próbálja megjósolni, értékelni és súlyozni a lehetséges akciókat.

Cloud & big data

Rendőri fellépés vetett véget az első utcai ember-robot veszekedésnek

A kínai Makaón egy idős asszony támadta le a háta mögött tébláboló humanoidot, aki véletlenül alaposan ráijesztett.
 
A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.