A DeepMind (Google) által fejlesztett legújabb mesterséges intelligencia, a DeepNash megtanulta, hogyan tudja jó eséllyel legyőzni még a legfelkészültebb emberi játékosokat is a Stratego nevű kétszemélyes társasjátékban, amelyben egy-egy negyven fős hadsereg küzd különböző rangú katonákkal az ellenfélzászlójának megszerzéséért. A korábban alkotott játékokra épülő, de széles körben a 60-as évek óta népszerű Stratego elég egyszerű szabályokkal rendelkezik hozzá, hogy akár a gyerekek is játszhassanak vele, de az alkalmazott stratégia mélysége a felnőttek számára is vonzóvá teszi.
Jellemző rá, hogy az ellenfelek alapértelmezett módon nem látják egymás a figuráinak a rangjelzéseit, így a teljesinformációs játékokkal (sakk, gó stb.) szemben a Stratego egy nem teljes információs játék. Ezzel jelentősen eltér a többi olyan társasjátéktól, amelyeket a korábbi DeepMind MI-k elsajátítottak, hiszen a játékosoknak a döntések meghozatalakor arra kell törekedniük, hogy egyensúlyban tartsák az összes lehetséges kimenetelt. A kutatók szerint ez összetettebbé teszi a többi játéknál, beleértve az említett sakkot vagy gót, de akár a pókert is, amelyben az MI már szintén jó eredményeket ért el.
Az MI blöffölni is megtanult
Számokban kifejezve ez azt jelenti, hogy a Strategóban még a góhoz képest is összehasonlíthatatlanul több játékállapot képzelhető el, így hatalmas eredmény, hogy a DeepNash minden idők legjobb három legjobb játékosa közé került a világ legnagyobb online Stratego platformján, a Gravonon”. A kutatók által közzétett cikk szerint a mesterséges intelligencia kiszámíthatatlan stratégiát dolgozott ki annak biztosítására, hogy emberi ellenfele kénytelen legyen minél tovább találgatni, sőt még azt is megtanulta, hogyan blöfföljön: a DeepMind itt egy korábbi Stratego-világbajnokot idéz, aki szerint egyenesen meglepő a DeepNash játékának színvonala.
Ezzel egy újabb, korábban feltörhetetlennek tartott játék esett el a gépi intelligencia előtt, hiszen korábban nem létezett olyan szoftver, amelyik akár csak megközelítette volna a legtapasztaltabb emberi játékosok szintjét. Ehhez képest legjobb Stratego-robotok ellen a DeepNash győzelmi rátája meghaladta a 97 százalékot, sőt egyes esetekben 100 százalékos volt, míg a Gravon játékplatform legjobb humán játékosaival szemben 84 százalékos győzelmi arányt ért el.
A DeepMind szerint a most kifejlesztett módszerek közvetlenül alkalmazhatók lesznek más, tökéletes vagy tökéletlen információkkal rendelkező, zérusösszegű kétjátékos játékokban is, ezen túlmutatva pedig olyan a nagyszabású valós problémák megoldására lesznek bevethetők, mint például a forgalomirányítás nagy léptékű optimalizálása az utazási idő és a kibocsátás csökkentésére.
A NIS2-megfelelőség néhány technológiai aspektusa
A legtöbb vállalatnál a megfeleléshez fejleszteni kell a védelmi rendszerek kulcselemeit is.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak