A legújabb mesterséges intelligencia is bekapcsolódik a zergek, protoss-ok és terranok háborújába – már persze azon felül, hogy eddig is humán fejlesztésű MI irányította a gépi játékosokat. Ezúttal azonban a játék eredeti keretein túlnyúló módon kerül bevetésre: a Facebook és az Oxfordi Egyetem kutatói a StarCraftot használják mélytanulási (deep learning) eljárások tesztelésére.
Ez egyébként csak elsőre tűnik vad ötletnek: az MI játékokon keresztül való tanítása egyre komolyabb üzletté növi ki magát. A számítógépes játékok ugyanis mérföldkőként viselkednek: ha a gép magabiztosan le tudja győzni az emberi játékosokat az egyre összetettebb programokban, az annak jele, hogy a neurális hálózata az intelligencia új szintjére fejlődött.
Az IBM szuperszámítógépe, a Deep Blue például az 1990-es évek végén győzedelmeskedett sakkban az emberi képességek felett (legyőzve a legnagyobb sakk nagymestereket is). A Google DeepMind mesterséges intelligenciája pedig idén győzte le Lee Sedol Go mestert.
TorchCraft
Ezek azonban csupán kombinációs lehetőségeik alapján jelentenek bonyolult környezetet, maguk a szabályok és az egyes lépések igen egyszerűek. Egy StarCraft-szintű játékban való győzelem elérése sokkal összetettebb feladat; ennek megoldását tűzte ki célul a fent említet brit egyetem és a közösségi hálózatot üzemeltető vállalat néhány kivételes koponyája. Az általuk létrehozott TorchCraft révén akarják tesztelni mélytanulási eljárásaikat a StraCrafthoz hasonló valós idejű stratégiai játékokban.
A TorchCraft neve a játék és a gépi tanulási könyvtár (Torch) összevonásából született. A StraCrafthoz hasonlóan bonyolult környezeteket kezelni képes MI ágensek létrehozásában segíti a fejlesztőket. Tulajdonképpen a Torch-ot kötötték össze a Blizzard játékával azáltal, hogy olyan kódot helyeztek el a StarCraft: Brood Warban, melytől az szerverként viselkedik. Ezzel információk nyerhetők ki a játék állásáról, melyek külső gépi tanulási algoritmusokhoz kerülnek, illetve parancsokat küldenek vissza a játékba.
Jelenleg már számos platform létezik különböző játékokhoz, de a kutatók szerint a Blizzard szoftvere jelenti az egyik legnagyobb kihívást. Napjaink StarCraft botjai – automatizált feladatvégrehajtó algoritmusai - legjobb esetben is csak közepes teljesítményre képesek, a játékosok elitjébe tartozók megverésére esélyük sincsen.
Kis starcraftológia
A játék célja az adott pálya, térkép teljes ellenőrzése. Ehhez épületek és termelő/harci egységek gyártásán keresztül vezet az út; előbbiekkel az erőforrások kiaknázásának tempója pörgethető fel, utóbbiakkal pedig megvédhető a bázis infrastruktúrája, a termelés folytonossága és ellehetetleníthető az ellenség hasonló tevékenysége.
Ahhoz, hogy valaki igazán hatékonyan játszhasson, el kell találja a fejlesztés, a terjeszkedés és a védekezés/támadás közötti kényes egyensúlyt. A megfelelő időben és tempóban kell ontani a támadó és védekező egységeket, kihasználva azok előnyeit és minimalizálni hátrányaikat. Azaz stratégiai gondolkodásra van szükség: nem csak a következő lépést, hanem azok hatásait is előre kell látni. Gyakran igen gyorsan kell döntéseket hozni, és az improvizáció sem ismeretlen az igazán jó játékos számára.
Ebben a környezetben kell(ene) tehát a maximumot kihozni a mesterséges intelligenciából. Jellemzően egyébként annyira komplex feladat egy igazán jó MI létrehozása, hogy a játékfejlesztők a játék nehézségeit csak bizonyos szintig képesek jobb algoritmusokkal modellezni. A nehéz és ultranehéz fokozatokon szinte kizárólag csak az a megoldás működik, hogy a gépi ellenfél „csal”: már induláskor nagyobb erőforrások felett rendelkezik a humán játékosokkal szemben és/vagy gyorsabban képes nagyobb erőforrásokat felhalmozni, egységeket létrehozni.
A győzelem másodlagos?
A kutatás állítása szerint a TorchCraft nem csak a Blizzard termékén használható, hanem gyakorlatilag bármelyik számítógépes játékra ráhúzható, és hasonló rugalmasságot ígér a gépi tanulás tekintetében is.
A végső cél persze nem csupán az, hogy az embereket eltántorítsa a játéktól a megverhetetlenné izmolt mesterséges intelligencia, sokkal inkább a valós környezetbe szánt MI-k tesztelésének lehetősége vonzza a kutatói figyelmet. Például a népszerű, egyébként gyakran erőszakos cselekmények elkövetésére bíztató Grand Theft Auto-t autonóm vezető szoftverek tesztelésére használják.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?