A Facebook MI-kutató részlege és a Carnegie Mellon University csütörtökön osztott meg részleteket a Pluribus nevű mesterséges intelligenciáról, amely a vállalat szerint a világ legelső, profi pókerjátékosokat üzembiztosan legyőző rendszere lett. A póker egyfajta benchmark szerepet tölt be a játékelméletben és a mesterséges intelligenciák teljesítményének összehasonlításában, így a mostani eredmény mérföldkőnek tekinthető ebben a műfajban: a robot 15 olyan hivatásos versenyzőt múlt felül, akik egyenként is több mint egymillió dollárt nyertek már karrierjük során.
Fontos megjegyezni, hogy az emberi teljesítményt már korábban is sikerült túlszárnyalni az MI-nek. 2017 februárjában a Libratus nevű, a no-limit heads-up Texas hold'em póker megfelelő variánsára felkészített program például úgy diadalmaskodott egy 20 napon át zajló pókerversenyen, hogy négyet is maga mögé utasított a világ legmagasabban jegyzett pókerjátékosai közül. A Pluribus tulajdonképpen ennek a rendszernek a továbbfejlesztett változata, ami már arra is képes volt, hogy konzisztens módon hozza a győzelmeket kettőnél több emberi ellenféllel szemben a teljesítményértékelő mérkőzéseken.
Saját magát edzi, és nulláról lesz legyőzhetetlen játékos
Az új program eredményeit összefüggésbe helyezi, hogy a korábbiakkal szemben teljesen önmagát tanító (a saját másolatai elleni játékból tanuló) megoldásról van szó, ami az emberi csúcsteljesítményt mindössze 20 órányi tanulást követően túlhaladja, és ehhez nincs szüksége korábbi emberi vagy MI-mérkőzések adataira. A rendszer legelőször teljesen véletlenszerű döntéseket hoz, majd fokozatosan fejlődik annak elemzésével, hogy melyik döntés és a döntésekhez kapcsolódó valószínűség-eloszlás vezetett kedvezőbb kimenetelre a korábbi stratégiáihoz képest.
A vesztes profi pókeresek már a Libratus esetében is úgy látták, hogy a szoftver otthonosan mozog a játék minden elemében: blöfföl, jó lapokkal alacsonyan hív, vagy éppen agresszív emelésekkel ejti ki az ellenfelet, összetett licitekkel hozva zavarba az ellenfeleket. A majdnem három hétig tartó verseny után demoralizálónak nevezték, hogy az MI egyre jobban kiismerte őket, és ha felfedeztek a játékában valamilyen gyenge pontot, a mesterséges intelligencia hamarosan korrigálta azt.
A Pluribus, amelynek fejlesztésehez a Carnegie Mellon University és a Facebook mellett a Strategic Machine, a Strategy Robot vagy az Optimized Markets nevű cégek is hozzájárultak, már az öt emberi játékos elleni mérkőzéseket is simán hozta: egydolláros chipekkel számolva osztásonként átlagosan 5 dollárt szerzett, ami óránként nagyjából 1000 dolláros plusznak feleltethető meg. Az MI a helyzettől függően 1-14 licitet értékel, de képes limitált tétekkel is játszani, ami az emberi ellenfelek kezét nyilvánvalóan nem köti meg hasonló módon.
A fejlődéshez nem áll rendelkezésre végtelen tartalék
A 20 órányi saját tanulásra visszatérve azt is érdemes megjegyezni, hogy a programnak mindehhez 150 dollárnyi cloud alapú számítási erőforrásra van szüksége. A dolog jelentősége abban áll, hogy a mesterséges intelligencia fejlődése a Moore-törvényt is hatályon kívül helyezte, amennyiben az aktuálisan legfejlettebb rendszerek kapacitásigénye már 2012 óta minden évben az előző évi szintek tízszeresére növekedett. Ahogy azt Jérôme Pesenti, a Facebook MI-fejlesztésekért felelős alelnöke egy friss előadásában elmondta, mára a legjelentősebb számítási erőforrásokkal rendelekző vállalatok is lényegében elérték azt a szintet, ahol egyszerűen képtelenség fenntartani ezt a tempót.
Pesenti úgy látja, hogy az erőforrásigény növekedése nem szűnik meg, de a közeljövőben lényegesen lelassul, és az innováció súlypontja az olyan szoftveres fejlesztésekre helyeződik át, amelyek biztosítják, hogy a mesterséges intelligencia fejlődése ilyen körülmények között se akadjon el. Ez a hardveres és szoftveres optimalizáció mutatkozik meg a Pluribus tanításához szükséges számítási kapacitásban is. Összehasonlításképpen, egy múlt hónapban közzétett elemzés szerint az olyan rendszerek egyetlen alkalommal való betantása, mint amilyen például az OpenAI GPT2 rendszere, nagyobb szén-dioxid-kibocsátást eredményezhet, mint amennyit öt személyautó a teljes élettartama alatt hoz össze.
Költségcsökkenésből finanszírozott modernizáció
A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?