A mélytanuló mesterséges intelligencia fejlődésében hatalmas mérföldkőnek tartják, hogy 2016-ban a gójátékban is sikerült megtörni az emberek felsőbbségét. A DeepMind AlphaGo programja mélytanuló neurális hálózatokat használt, hogy olyan szinten sajátítsa el a gót, amivel már a legmagasabban jegyzett játékosok sem tudtak lépést tartani. A rendszer egy következő, AlphaGo Zero nevű változata pedig arra is képes volt, hogy külső segítség nélkül, saját maga ellen játszva tanulja meg a játékot, és mindössze háromnapos felkészülés után 100-0 arányban rommá verje az Alpha Go korábbi, emberi bajnokokat legyőző verzióját.
Mindezzel kapcsolatban a legújabb érekesség, hogy az MIT, a UC Berkeley és a Fund for Alignment Research kutatói sikeresen tanítottak be egy mesterségesintelligencia-modellt a gójátékban egy ideje a legerősebbnek tartott MI-program, a KataGo legyőzésére. A nyílt forrású KataGo az AlphaGo alapjaira épül, de olyan további megoldásokat is felvonultat, amelyek segítségével annál is hatékonyabbá tették a rendszer tanulását. Így az eredmény már önmagában szót érdemelne, de a lényeg most nem az, hogy megszületett volna egy erősebb kihívó, hanem az, hogy tulajdonképpen a KataGo elleni célzott támadást vittek sikerre.
Nem emberiek sem az erősségeik, sem a gyengeségeik
A trükk lényege, hogy a tudósok által felkészített rendszer képes rávenni a KataGót, hogy idő előtt úgy értékelje, megnyerte a mérkőzést. Emiatt a KataGo passzol (a góban egy bizonyos ponton túl a győztes játékosnak nincs értelme további lépéseket tennie), az ellenfele pedig csak erre vár, és szintén passzol. A szabályok szerint ilyenkor azonnal vége a játéknak, amit KataGo így jó eséllyel el is veszít. A kutatók által kiképzett neurális hálózat tehát a KataGo stratégiájában lévő lyukakra specializálódott ahelyett, hogy erős gójátékossá fejlődött volna: a jóindulattal is csak közepes emberi játékosok például gond nélkül meg tudják verni.
Fontos tisztázni, hogy a szóban forgó amatőrök nem tudják legyőzni KataGót a modell által alkalmazott stratégiájával, így nem is maga a stratégia a lényeges a dologban, hanem a képesség a KataGo konkrét hibáinak kihasználására. Összességében tehát nem avattak új bajnokot a góprogramok között, de látványosan demonstrálták, hogy a neurális hálózatok mennyire törékenyek az olyan támadásokkal szemben, amelyek a meghatározott sajátosságaikat próbálják kihasználni. Még a játéktábla korlátozott kontextusában emberfeletti teljesítményt nyújtó modellt is le lehet győzni valamilyen egyszerű, de szokatlan haditervvel.
Az Ars Technica beszámolója a kutatási projekt egyik résztvevőjét idézi, aki szerint az emberek szintjén teljesítő MI-modellek valójában nagyon idegen módokon teszik ezt, amiből az is következik, hogy az emberek számára meglepő módon tudnak meghibásodni. A dolog pedig lehet, hogy a gójátékban szórakoztató, de az már kevésbé lesz vicces, amikor a biztonsági szempontból kritikus mesterségesintelligencia-rendszereket (mondjuk egy önvezető autó MI-jét) is hasonló módon sikerül majd letérdeltetni. A tudósok szerint nagy szükség lenne az automatizált tesztelés javítására, hogy felfedjék a legrosszabb meghibásodások lehetőségeit.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak