A DeepMind MuZero nevű új modellje már a gó, a sakk vagy a sógi szabályait is bármilyen segítség nélkül, saját maga tanulja meg, ami rengeteg gyakorlati MI-alkalmazásban lehet majd nagyon hasznos képesség.
Hirdetés
 

Már több int három és fél éve, hogy az Alphabet DeepMind részlege által fejlesztett AlphaGo mesterséges intelligencia legyőzte a világ egyik legerősebb gójátékosát. A dél-koreai I Szedol a legfrissebb hírek szerint éppen ezzel indokolta visszavonulását a professzionális versenyzéstől: a Jonhap hírügynökségnek nyilatkozva kifejtette, hogy az MI legyőzhetetlen, és erre ma már akkor sem lehet képes senki, ha máskülönben hatalmas erőfeszítések árán a legmagasabban jegyzett emberi játékossá válik.

Az AlphaGo 2016-os sikere fontos lépcső volt a mesterséges intelligencia fejlődésében, mivel a gójátékban nem lehet ilyen sikereket elérni pusztán a számítógépek gyorsan növkvő számítási kapacitására alapozva. Ahogy akkor is írtuk, a DeepMind megközelítése újdonságnak számított a rendszer ideghálót modellező felépítése és a sztochasztikus keresés kombinációjával.

A DeepMind 2017-ben már azzal került be a hírekbe, hogy az AlphaGo AlphaZero nevű változata 100-0 arányban verte meg a rendszer korábbi, a dél-koreai profi versenyzőt is legyőző verzióját. Ez ráadásul úgy sikerült neki, hogy mindössze három nappal azelőtt kezdték megtanítani a játékra, és a tanulás során csak saját csak a maga elleni, kezdetben még véletlenszerű gyakorló mérkőzéseket játszott.

Tavaly a Science magazinban közölték, hogy az AlphaZero a gó, a sakk és a japán sakknak is nevezett sógi önálló betanulására is képes, minden esetben úgy, hogy a rövid folyamat végén gond nélkül képes megverni a legjobb emberi játékosokat. Néhány napja pedig beszámoltak a MuZero nevű modell eredményeiről is, amely annyiben jelent újabb előrelépést, hogy a játékok szabályokat is egyedül tanulja meg, és rövid idő után így hozza az AlphaZero teljesítményével megegyező szintet.

A kutatók szerint a látszólag apró lépésnek nagyon nagy jelentősége van, amennyiben a most alkalmazott megoldások előkészítenek egy nagy csomó sokkal konkrétabb, a való világban is bevethető MI-felhasználást. Ez azokban az esetekben érdekes, amikor nincslehetőség szimulációk futtatására, hogy azokon keresztül kommunikálják a megfelelő szabályokat és az adott környezetek dinamikáját.

Az eddigi tervező algoritmusok ugyanis, akármilyen hatékonyak, úgy értek el sikereket, hogy lészen kaptak valamilyen meglévő tudásanyagot – ha mást nem, az adott játékok szabályait vagy valamilyen pontos szimulációt.A MuZero ezzel szemben maga végez megfigyeléseket (például az Atari gójátékának állásairól készült képernyőképeket), és ezek alapján próbálja megjósolni, értékelni és súlyozni a lehetséges akciókat.

Cloud & big data

A magyarok sem bíznak abban, hogy a kormány csak jóra használja erejét

A titkosított kommunikációt biztosító Wickr használati statisztikái szoros összefüggést mutatnak a bizalom mértéke és egyik termékük telepítési gyakorisága között.
 
A biztonság kiszervezéséhez komoly bizalmi tőke kell, ami lassan épül fel, de tartósabb is, mint a betyárbecsület.

a melléklet támogatója a Euro One

Nem általában a távmunkáé, hanem a mostani tipikus távmunka-helyzeteké. A szervezetek arra nem voltak felkészülve, hogy mindenki otthonról dolgozik.

Alapjaiban kell megújítani a biztonságról kialakított felfogásunkat

Mi köze az IBM licencszerződések apró betűs kitételeinek ahhoz, hogy a Microsoft Windows Server 2008 életciklusának végéhez ér? Rogányi Dániel (IPR-Insights) írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2020 Bitport.hu Média Kft. Minden jog fenntartva.