Nem lassít a legnagyobbakat is legyőző mesterséges intelligencia

Bitport2019.11.29.Cloud & big data

A DeepMind MuZero nevű új modellje már a gó, a sakk vagy a sógi szabályait is bármilyen segítség nélkül, saját maga tanulja meg, ami rengeteg gyakorlati MI-alkalmazásban lehet majd nagyon hasznos képesség.

Már több int három és fél éve, hogy az Alphabet DeepMind részlege által fejlesztett AlphaGo mesterséges intelligencia legyőzte a világ egyik legerősebb gójátékosát. A dél-koreai I Szedol a legfrissebb hírek szerint éppen ezzel indokolta visszavonulását a professzionális versenyzéstől: a Jonhap hírügynökségnek nyilatkozva kifejtette, hogy az MI legyőzhetetlen, és erre ma már akkor sem lehet képes senki, ha máskülönben hatalmas erőfeszítések árán a legmagasabban jegyzett emberi játékossá válik.

Az AlphaGo 2016-os sikere fontos lépcső volt a mesterséges intelligencia fejlődésében, mivel a gójátékban nem lehet ilyen sikereket elérni pusztán a számítógépek gyorsan növkvő számítási kapacitására alapozva. Ahogy akkor is írtuk, a DeepMind megközelítése újdonságnak számított a rendszer ideghálót modellező felépítése és a sztochasztikus keresés kombinációjával.

A DeepMind 2017-ben már azzal került be a hírekbe, hogy az AlphaGo AlphaZero nevű változata 100-0 arányban verte meg a rendszer korábbi, a dél-koreai profi versenyzőt is legyőző verzióját. Ez ráadásul úgy sikerült neki, hogy mindössze három nappal azelőtt kezdték megtanítani a játékra, és a tanulás során csak saját csak a maga elleni, kezdetben még véletlenszerű gyakorló mérkőzéseket játszott.

Tavaly a Science magazinban közölték, hogy az AlphaZero a gó, a sakk és a japán sakknak is nevezett sógi önálló betanulására is képes, minden esetben úgy, hogy a rövid folyamat végén gond nélkül képes megverni a legjobb emberi játékosokat. Néhány napja pedig beszámoltak a MuZero nevű modell eredményeiről is, amely annyiben jelent újabb előrelépést, hogy a játékok szabályokat is egyedül tanulja meg, és rövid idő után így hozza az AlphaZero teljesítményével megegyező szintet.

A kutatók szerint a látszólag apró lépésnek nagyon nagy jelentősége van, amennyiben a most alkalmazott megoldások előkészítenek egy nagy csomó sokkal konkrétabb, a való világban is bevethető MI-felhasználást. Ez azokban az esetekben érdekes, amikor nincslehetőség szimulációk futtatására, hogy azokon keresztül kommunikálják a megfelelő szabályokat és az adott környezetek dinamikáját.

Az eddigi tervező algoritmusok ugyanis, akármilyen hatékonyak, úgy értek el sikereket, hogy lészen kaptak valamilyen meglévő tudásanyagot – ha mást nem, az adott játékok szabályait vagy valamilyen pontos szimulációt.A MuZero ezzel szemben maga végez megfigyeléseket (például az Atari gójátékának állásairól készült képernyőképeket), és ezek alapján próbálja megjósolni, értékelni és súlyozni a lehetséges akciókat.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hogyan lett a riportolásból döntésautomatizálás?

Az üzleti intelligencia sokáig a múltban történtek értékelésről szólt. Napjainkban viszont már inkább az a kérdés, hogy mi történik holnap; különösen akkor, ha módosítjuk a vállalati működés valamelyik paraméterét.

A hónap témája

Hogyan lett a riportolásból döntésautomatizálás?

a melléklet támogatója a One Solutions

CIO Podcast

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

CIO Podcast #66: A DÁP projekt és a piac. A szembesítés félórája

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hogyan lett a riportolásból döntésautomatizálás?

Hogyan lett a riportolásból döntésautomatizálás?

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia