A teljesinformációs játékokban az MI már hosszú ideje jól teljesít, de a DeepMind most kifejlesztett egy olyan modellt, amelyik a legmagasabban jegyzett embereket is elveri a Stratego nevű társasjátékban.

A DeepMind (Google) által fejlesztett legújabb mesterséges intelligencia, a DeepNash megtanulta, hogyan tudja jó eséllyel legyőzni még a legfelkészültebb emberi játékosokat is a Stratego nevű kétszemélyes társasjátékban, amelyben egy-egy negyven fős hadsereg küzd különböző rangú katonákkal az ellenfélzászlójának megszerzéséért. A korábban alkotott játékokra épülő, de széles körben a 60-as évek óta népszerű Stratego elég egyszerű szabályokkal rendelkezik hozzá, hogy akár a gyerekek is játszhassanak vele, de az alkalmazott stratégia mélysége a felnőttek számára is vonzóvá teszi.

Jellemző rá, hogy az ellenfelek alapértelmezett módon nem látják egymás a figuráinak a rangjelzéseit, így a teljesinformációs játékokkal (sakk, gó stb.) szemben a Stratego egy nem teljes információs játék. Ezzel jelentősen eltér a többi olyan társasjátéktól, amelyeket a korábbi DeepMind MI-k elsajátítottak, hiszen a játékosoknak a döntések meghozatalakor arra kell törekedniük, hogy egyensúlyban tartsák az összes lehetséges kimenetelt. A kutatók szerint ez összetettebbé teszi a többi játéknál, beleértve az említett sakkot vagy gót, de akár a pókert is, amelyben az MI már szintén jó eredményeket ért el.

Az MI blöffölni is megtanult

Számokban kifejezve ez azt jelenti, hogy a Strategóban még a góhoz képest is összehasonlíthatatlanul több játékállapot képzelhető el, így hatalmas eredmény, hogy a DeepNash minden idők legjobb három legjobb játékosa közé került a világ legnagyobb online Stratego platformján, a Gravonon”. A kutatók által közzétett cikk szerint a mesterséges intelligencia kiszámíthatatlan stratégiát dolgozott ki annak biztosítására, hogy emberi ellenfele kénytelen legyen minél tovább találgatni, sőt még azt is megtanulta, hogyan blöfföljön: a DeepMind itt egy korábbi Stratego-világbajnokot idéz, aki szerint egyenesen meglepő a DeepNash játékának színvonala.

Ezzel egy újabb, korábban feltörhetetlennek tartott játék esett el a gépi intelligencia előtt, hiszen korábban nem létezett olyan szoftver, amelyik akár csak megközelítette volna a legtapasztaltabb emberi játékosok szintjét. Ehhez képest legjobb Stratego-robotok ellen a DeepNash győzelmi rátája meghaladta a 97 százalékot, sőt egyes esetekben 100 százalékos volt, míg a Gravon játékplatform legjobb humán játékosaival szemben 84 százalékos győzelmi arányt ért el.

A DeepMind szerint a most kifejlesztett módszerek közvetlenül alkalmazhatók lesznek más, tökéletes vagy tökéletlen információkkal rendelkező, zérusösszegű kétjátékos játékokban is, ezen túlmutatva pedig olyan a nagyszabású valós problémák megoldására lesznek bevethetők, mint például a forgalomirányítás nagy léptékű optimalizálása az utazási idő és a kibocsátás csökkentésére.

Részletek a DeepMind blogján »

Cloud & big data

Az Nvidia vezetője félreérti, mitől lesz visszautasíthatatlan egy ajánlat

Máshol csak a pénztártól való távozás után nem fogadják el a reklamációt, de Jensen Huang már azt is teljes tévedésnek tartja, ha valaki nem jön be nézelődni az MI-boltba.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.