A Facebook MI-kutató részlege és a Carnegie Mellon University csütörtökön osztott meg részleteket a Pluribus nevű mesterséges intelligenciáról, amely a vállalat szerint a világ legelső, profi pókerjátékosokat üzembiztosan legyőző rendszere lett. A póker egyfajta benchmark szerepet tölt be a játékelméletben és a mesterséges intelligenciák teljesítményének összehasonlításában, így a mostani eredmény mérföldkőnek tekinthető ebben a műfajban: a robot 15 olyan hivatásos versenyzőt múlt felül, akik egyenként is több mint egymillió dollárt nyertek már karrierjük során.
Fontos megjegyezni, hogy az emberi teljesítményt már korábban is sikerült túlszárnyalni az MI-nek. 2017 februárjában a Libratus nevű, a no-limit heads-up Texas hold'em póker megfelelő variánsára felkészített program például úgy diadalmaskodott egy 20 napon át zajló pókerversenyen, hogy négyet is maga mögé utasított a világ legmagasabban jegyzett pókerjátékosai közül. A Pluribus tulajdonképpen ennek a rendszernek a továbbfejlesztett változata, ami már arra is képes volt, hogy konzisztens módon hozza a győzelmeket kettőnél több emberi ellenféllel szemben a teljesítményértékelő mérkőzéseken.
Saját magát edzi, és nulláról lesz legyőzhetetlen játékos
Az új program eredményeit összefüggésbe helyezi, hogy a korábbiakkal szemben teljesen önmagát tanító (a saját másolatai elleni játékból tanuló) megoldásról van szó, ami az emberi csúcsteljesítményt mindössze 20 órányi tanulást követően túlhaladja, és ehhez nincs szüksége korábbi emberi vagy MI-mérkőzések adataira. A rendszer legelőször teljesen véletlenszerű döntéseket hoz, majd fokozatosan fejlődik annak elemzésével, hogy melyik döntés és a döntésekhez kapcsolódó valószínűség-eloszlás vezetett kedvezőbb kimenetelre a korábbi stratégiáihoz képest.
A vesztes profi pókeresek már a Libratus esetében is úgy látták, hogy a szoftver otthonosan mozog a játék minden elemében: blöfföl, jó lapokkal alacsonyan hív, vagy éppen agresszív emelésekkel ejti ki az ellenfelet, összetett licitekkel hozva zavarba az ellenfeleket. A majdnem három hétig tartó verseny után demoralizálónak nevezték, hogy az MI egyre jobban kiismerte őket, és ha felfedeztek a játékában valamilyen gyenge pontot, a mesterséges intelligencia hamarosan korrigálta azt.
A Pluribus, amelynek fejlesztésehez a Carnegie Mellon University és a Facebook mellett a Strategic Machine, a Strategy Robot vagy az Optimized Markets nevű cégek is hozzájárultak, már az öt emberi játékos elleni mérkőzéseket is simán hozta: egydolláros chipekkel számolva osztásonként átlagosan 5 dollárt szerzett, ami óránként nagyjából 1000 dolláros plusznak feleltethető meg. Az MI a helyzettől függően 1-14 licitet értékel, de képes limitált tétekkel is játszani, ami az emberi ellenfelek kezét nyilvánvalóan nem köti meg hasonló módon.
A fejlődéshez nem áll rendelkezésre végtelen tartalék
A 20 órányi saját tanulásra visszatérve azt is érdemes megjegyezni, hogy a programnak mindehhez 150 dollárnyi cloud alapú számítási erőforrásra van szüksége. A dolog jelentősége abban áll, hogy a mesterséges intelligencia fejlődése a Moore-törvényt is hatályon kívül helyezte, amennyiben az aktuálisan legfejlettebb rendszerek kapacitásigénye már 2012 óta minden évben az előző évi szintek tízszeresére növekedett. Ahogy azt Jérôme Pesenti, a Facebook MI-fejlesztésekért felelős alelnöke egy friss előadásában elmondta, mára a legjelentősebb számítási erőforrásokkal rendelekző vállalatok is lényegében elérték azt a szintet, ahol egyszerűen képtelenség fenntartani ezt a tempót.
Pesenti úgy látja, hogy az erőforrásigény növekedése nem szűnik meg, de a közeljövőben lényegesen lelassul, és az innováció súlypontja az olyan szoftveres fejlesztésekre helyeződik át, amelyek biztosítják, hogy a mesterséges intelligencia fejlődése ilyen körülmények között se akadjon el. Ez a hardveres és szoftveres optimalizáció mutatkozik meg a Pluribus tanításához szükséges számítási kapacitásban is. Összehasonlításképpen, egy múlt hónapban közzétett elemzés szerint az olyan rendszerek egyetlen alkalommal való betantása, mint amilyen például az OpenAI GPT2 rendszere, nagyobb szén-dioxid-kibocsátást eredményezhet, mint amennyit öt személyautó a teljes élettartama alatt hoz össze.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak