Újfajta játékban zárkózott fel hozzánk a mesterséges intelligencia

Bitport2022.12.06.Cloud & big data

A teljesinformációs játékokban az MI már hosszú ideje jól teljesít, de a DeepMind most kifejlesztett egy olyan modellt, amelyik a legmagasabban jegyzett embereket is elveri a Stratego nevű társasjátékban.

A DeepMind (Google) által fejlesztett legújabb mesterséges intelligencia, a DeepNash megtanulta, hogyan tudja jó eséllyel legyőzni még a legfelkészültebb emberi játékosokat is a Stratego nevű kétszemélyes társasjátékban, amelyben egy-egy negyven fős hadsereg küzd különböző rangú katonákkal az ellenfélzászlójának megszerzéséért. A korábban alkotott játékokra épülő, de széles körben a 60-as évek óta népszerű Stratego elég egyszerű szabályokkal rendelkezik hozzá, hogy akár a gyerekek is játszhassanak vele, de az alkalmazott stratégia mélysége a felnőttek számára is vonzóvá teszi.

Jellemző rá, hogy az ellenfelek alapértelmezett módon nem látják egymás a figuráinak a rangjelzéseit, így a teljesinformációs játékokkal (sakk, gó stb.) szemben a Stratego egy nem teljes információs játék. Ezzel jelentősen eltér a többi olyan társasjátéktól, amelyeket a korábbi DeepMind MI-k elsajátítottak, hiszen a játékosoknak a döntések meghozatalakor arra kell törekedniük, hogy egyensúlyban tartsák az összes lehetséges kimenetelt. A kutatók szerint ez összetettebbé teszi a többi játéknál, beleértve az említett sakkot vagy gót, de akár a pókert is, amelyben az MI már szintén jó eredményeket ért el.

Az MI blöffölni is megtanult

Számokban kifejezve ez azt jelenti, hogy a Strategóban még a góhoz képest is összehasonlíthatatlanul több játékállapot képzelhető el, így hatalmas eredmény, hogy a DeepNash minden idők legjobb három legjobb játékosa közé került a világ legnagyobb online Stratego platformján, a Gravonon”. A kutatók által közzétett cikk szerint a mesterséges intelligencia kiszámíthatatlan stratégiát dolgozott ki annak biztosítására, hogy emberi ellenfele kénytelen legyen minél tovább találgatni, sőt még azt is megtanulta, hogyan blöfföljön: a DeepMind itt egy korábbi Stratego-világbajnokot idéz, aki szerint egyenesen meglepő a DeepNash játékának színvonala.

Ezzel egy újabb, korábban feltörhetetlennek tartott játék esett el a gépi intelligencia előtt, hiszen korábban nem létezett olyan szoftver, amelyik akár csak megközelítette volna a legtapasztaltabb emberi játékosok szintjét. Ehhez képest legjobb Stratego-robotok ellen a DeepNash győzelmi rátája meghaladta a 97 százalékot, sőt egyes esetekben 100 százalékos volt, míg a Gravon játékplatform legjobb humán játékosaival szemben 84 százalékos győzelmi arányt ért el.

A DeepMind szerint a most kifejlesztett módszerek közvetlenül alkalmazhatók lesznek más, tökéletes vagy tökéletlen információkkal rendelkező, zérusösszegű kétjátékos játékokban is, ezen túlmutatva pedig olyan a nagyszabású valós problémák megoldására lesznek bevethetők, mint például a forgalomirányítás nagy léptékű optimalizálása az utazási idő és a kibocsátás csökkentésére.

Részletek a DeepMind blogján »

Cloud & big data

OpenAI-incidens: olcsó reklám vagy valós veszély?

A szakértő szerint tekintsük inkább egy nagyon fontos figyelmeztetésnek.

Hirdetés

Öt kérdés, amelyet érdemes feltenni felhőplatform-választás előtt

Egy felhőplatform értékét nemcsak a szolgáltatásai határozzák meg, hanem az is, hogy egy kritikus helyzetben mennyire képes támogatni a vállalat működését.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

OpenAI-incidens: olcsó reklám vagy valós veszély?

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!