Nem csak azért nagy szám a Facebook MI-je, mert elintézte a legjobb pókerjátékosokat

Bitport2019.07.13.Cloud & big data

Az új változat 20 órán keresztül saját magával játszik, és ezalatt úgy megtanul pókerezni, hogy emberek már nemigen győzhetik le. Mindezt ráadásul nem csak hamar, de meglepően alacsony gépigénnyel éri el.

A Facebook MI-kutató részlege és a Carnegie Mellon University csütörtökön osztott meg részleteket a Pluribus nevű mesterséges intelligenciáról, amely a vállalat szerint a világ legelső, profi pókerjátékosokat üzembiztosan legyőző rendszere lett. A póker egyfajta benchmark szerepet tölt be a játékelméletben és a mesterséges intelligenciák teljesítményének összehasonlításában, így a mostani eredmény mérföldkőnek tekinthető ebben a műfajban: a robot 15 olyan hivatásos versenyzőt múlt felül, akik egyenként is több mint egymillió dollárt nyertek már karrierjük során.

Fontos megjegyezni, hogy az emberi teljesítményt már korábban is sikerült túlszárnyalni az MI-nek. 2017 februárjában a Libratus nevű, a no-limit heads-up Texas hold'em póker megfelelő variánsára felkészített program például úgy diadalmaskodott egy 20 napon át zajló pókerversenyen, hogy négyet is maga mögé utasított a világ legmagasabban jegyzett pókerjátékosai közül. A Pluribus tulajdonképpen ennek a rendszernek a továbbfejlesztett változata, ami már arra is képes volt, hogy konzisztens módon hozza a győzelmeket kettőnél több emberi ellenféllel szemben a teljesítményértékelő mérkőzéseken.

Saját magát edzi, és nulláról lesz legyőzhetetlen játékos

Az új program eredményeit összefüggésbe helyezi, hogy a korábbiakkal szemben teljesen önmagát tanító (a saját másolatai elleni játékból tanuló) megoldásról van szó, ami az emberi csúcsteljesítményt mindössze 20 órányi tanulást követően túlhaladja, és ehhez nincs szüksége korábbi emberi vagy MI-mérkőzések adataira. A rendszer legelőször teljesen véletlenszerű döntéseket hoz, majd fokozatosan fejlődik annak elemzésével, hogy melyik döntés és a döntésekhez kapcsolódó valószínűség-eloszlás vezetett kedvezőbb kimenetelre a korábbi stratégiáihoz képest.

A vesztes profi pókeresek már a Libratus esetében is úgy látták, hogy a szoftver otthonosan mozog a játék minden elemében: blöfföl, jó lapokkal alacsonyan hív, vagy éppen agresszív emelésekkel ejti ki az ellenfelet, összetett licitekkel hozva zavarba az ellenfeleket. A majdnem három hétig tartó verseny után demoralizálónak nevezték, hogy az MI egyre jobban kiismerte őket, és ha felfedeztek a játékában valamilyen gyenge pontot, a mesterséges intelligencia hamarosan korrigálta azt.

A Pluribus, amelynek fejlesztésehez a Carnegie Mellon University és a Facebook mellett a Strategic Machine, a Strategy Robot vagy az Optimized Markets nevű cégek is hozzájárultak, már az öt emberi játékos elleni mérkőzéseket is simán hozta: egydolláros chipekkel számolva osztásonként átlagosan 5 dollárt szerzett, ami óránként nagyjából 1000 dolláros plusznak feleltethető meg. Az MI a helyzettől függően 1-14 licitet értékel, de képes limitált tétekkel is játszani, ami az emberi ellenfelek kezét nyilvánvalóan nem köti meg hasonló módon.

A fejlődéshez nem áll rendelkezésre végtelen tartalék

A 20 órányi saját tanulásra visszatérve azt is érdemes megjegyezni, hogy a programnak mindehhez 150 dollárnyi cloud alapú számítási erőforrásra van szüksége. A dolog jelentősége abban áll, hogy a mesterséges intelligencia fejlődése a Moore-törvényt is hatályon kívül helyezte, amennyiben az aktuálisan legfejlettebb rendszerek kapacitásigénye már 2012 óta minden évben az előző évi szintek tízszeresére növekedett. Ahogy azt Jérôme Pesenti, a Facebook MI-fejlesztésekért felelős alelnöke egy friss előadásában elmondta, mára a legjelentősebb számítási erőforrásokkal rendelekző vállalatok is lényegében elérték azt a szintet, ahol egyszerűen képtelenség fenntartani ezt a tempót.

Pesenti úgy látja, hogy az erőforrásigény növekedése nem szűnik meg, de a közeljövőben lényegesen lelassul, és az innováció súlypontja az olyan szoftveres fejlesztésekre helyeződik át, amelyek biztosítják, hogy a mesterséges intelligencia fejlődése ilyen körülmények között se akadjon el. Ez a hardveres és szoftveres optimalizáció mutatkozik meg a Pluribus tanításához szükséges számítási kapacitásban is. Összehasonlításképpen, egy múlt hónapban közzétett elemzés szerint az olyan rendszerek egyetlen alkalommal való betantása, mint amilyen például az OpenAI GPT2 rendszere, nagyobb szén-dioxid-kibocsátást eredményezhet, mint amennyit öt személyautó a teljes élettartama alatt hoz össze.

Cloud & big data

Alaposan kitömi az Nvidia az OpenAI lelépett társalapítójának MI-cégét

A Safe Superintelligence több milliárd dollár értékű megállapodást kötött az Nvidiával, amivel biztosítaná, hogy piaci nyomás nélkül dolgozhasson a biztonságos szuperintelligencia magasabb szintű technikai megoldásain.

Hirdetés

Öt kérdés, amelyet érdemes feltenni felhőplatform-választás előtt

Egy felhőplatform értékét nemcsak a szolgáltatásai határozzák meg, hanem az is, hogy egy kritikus helyzetben mennyire képes támogatni a vállalat működését.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Alaposan kitömi az Nvidia az OpenAI lelépett társalapítójának MI-cégét

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!