Lassan már nehezebb lesz olyan játékot találni, ahol a gépi intelligencia egy speciális verziója már ne lenne képes legalább olyan jól teljesíteni, mint az emberek. Ha csak a tradicionális táblás játékokra gondolunk, ott a sakk korai elestét a go, majd a sógi "bukása" követte. Ráadásul az utóbbiak mögött álló algoritmus továbbfejlesztett változata már mindenféle külső támogatás nélkül, pusztán magával játszott partikkal ért még magasabb szintekre.
A bizánci diplomácia finomságai
Vannak azonban olyan társasjátékok, amelyek lényegét nem a szabályok által megengedett lehetőségek logikus/optimális használata adja. Ilyen az először 1959-ben megjelent Diplomacy is, ahol maximum 7 játékos igyekszik a XX. század elején jelentősnek számító európai nagyhatalmak egyikét vezetve túljárni a többiek eszén. A győzelemhez ugyanis rengeteg külön tárgyalásra, egyezkedésre van szükség, ahol a meggyőzési képesség legalább olyan fontos fegyver, mint a jókor végrehajtott árulás.
A Meta kutatóinak ezt a gépek számára meglehetősen ingoványosnak tűnő terepet sikerült meghódítaniuk a Cicero nevet viselő mesterségesintelligencia-modelljükkel. A cég témával kapcsolatos blogposztja szerint a tulajdonképpen egy fejlett csetbotként megnyilánuló algoritmus képes megérteni az emberi ellenfelek motivációját, elemezni a taktikai/stratégiai lehetőségeket, miközben szabatos mondatokban igyekszik saját érdekei szerint alakítani a kétoldalú tárgyalásokat.
A rendszer mindezt egy 2,7 milliárd paraméteres, BART-szerű nyelvi modell segítségével képes megtenni, amelynek betanításához többek között a webDiplomacy.net oldalon online játszott több mint 40 ezer partiból származó adathalmazt is felhasználták. Ezek a játék összesen több mint 12 millió, játékosok között váltott üzenetet tartalmaztak.
A párbeszédhez szükséges szándékok létrehozásához és az egyes fordulókban végrehajtandó végső lépések kiválasztásához a Cicero egy stratégiai érvelő modult is futtat, amely a tábla állapota és a megosztott párbeszéd alapján megjósolja a többi játékos stratégiáját (azaz a lépések valószínűségi eloszlását) az aktuális fordulóra, majd olyan lépést választ magának az aktuális fordulóra, amely optimálisan reagál a többi játékos megjósolt akiójára.
Kiállta a puding próbáját
Munkájuk eredményét a gyakorlatban is sikerült bizonyítaniuk a kutatóknak. A Cicero az említett internetes oldalon 40 partit játszott a "blitz" ligában. Itt a legalább öt játékot játszó 19 játékos között a második helyen végzett. A partikon a gép átlag 25,8 százalékos eredményt hozott, ami több mint a duplája a 82 emberi ellenfél által összehozott 12,4 százalékos átlagnak. Az már csak hab a tortán, hogy sok játékos abszolút pozitívan nyilatkozott Cicero kommunikációjáról és együttműködési képességeiről, sokszor preferált játékostársként jelölve meg a mesterséges intelligenciát.
Meggyőző eredményei ellenére az algoritmus azonban még a készítői szerint sem tökéletes. Erre példa a fenti párbeszéd is, ahol a gép egy emberi játékossal folyó tárgyalás során egymásnak ellentmondó javaslatokkal állt elő.
Amennyiben azonban ezeket a hiányosságokat sikerül kijavítani, a rendszer egy csomó területen lehet képes új minőséget hozni. A kutatócsapat reményei szerint projektjük hasznosítható lesz hosszú beszélgetésekre képes csetbotok megalkotásánál, vagy éppen videojátékokban megjelenő nem játékos által irányított karaktereknél, amelyek a fenti tudással felvértezve jobban megérthetik a húsvér játékos motivációját, így utóbbival életszerűbb interakciót folytathatnak.
A Meta egyébként nem tartja hét lakat alatt a fejlesztés eddigi eredményét. A Cicero kódja nyílt forráskódú licenc alatt elérhető, amitől azt reméli a vállalat, hogy a mesterséges intelligencia fejlesztésében érdekelt szakmai közösség tovább tudja azt fejleszteni.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak