Egy új algoritmus olyan lépésekkel győzi le a gójátékban a legmenőbb MI-modellt, amelyekkel egy közepes emberi játékostól simán kikapna.

A mélytanuló mesterséges intelligencia fejlődésében hatalmas mérföldkőnek tartják, hogy 2016-ban a gójátékban is sikerült megtörni az emberek felsőbbségét. A DeepMind AlphaGo programja mélytanuló neurális hálózatokat használt, hogy olyan szinten sajátítsa el a gót, amivel már a legmagasabban jegyzett játékosok sem tudtak lépést tartani. A rendszer egy következő, AlphaGo Zero nevű változata pedig arra is képes volt, hogy külső segítség nélkül, saját maga ellen játszva tanulja meg a játékot, és mindössze háromnapos felkészülés után 100-0 arányban rommá verje az Alpha Go korábbi, emberi bajnokokat legyőző verzióját.

Mindezzel kapcsolatban a legújabb érekesség, hogy az MIT, a UC Berkeley és a Fund for Alignment Research kutatói sikeresen tanítottak be egy mesterségesintelligencia-modellt a gójátékban egy ideje a legerősebbnek tartott MI-program, a KataGo legyőzésére. A nyílt forrású KataGo az AlphaGo alapjaira épül, de olyan további megoldásokat is felvonultat, amelyek segítségével annál is hatékonyabbá tették a rendszer tanulását. Így az eredmény már önmagában szót érdemelne, de a lényeg most nem az, hogy megszületett volna egy erősebb kihívó, hanem az, hogy tulajdonképpen a KataGo elleni célzott támadást vittek sikerre.

Nem emberiek sem az erősségeik, sem a gyengeségeik

A trükk lényege, hogy a tudósok által felkészített rendszer képes rávenni a KataGót, hogy idő előtt úgy értékelje, megnyerte a mérkőzést. Emiatt a KataGo passzol (a góban egy bizonyos ponton túl a győztes játékosnak nincs értelme további lépéseket tennie), az ellenfele pedig csak erre vár, és szintén passzol. A szabályok szerint ilyenkor azonnal vége a játéknak, amit KataGo így jó eséllyel el is veszít. A kutatók által kiképzett neurális hálózat tehát a KataGo stratégiájában lévő lyukakra specializálódott ahelyett, hogy erős gójátékossá fejlődött volna: a jóindulattal is csak közepes emberi játékosok például gond nélkül meg tudják verni.

Fontos tisztázni, hogy a szóban forgó amatőrök nem tudják legyőzni KataGót a modell által alkalmazott stratégiájával, így nem is maga a stratégia a lényeges a dologban, hanem a képesség a KataGo konkrét hibáinak kihasználására. Összességében tehát nem avattak új bajnokot a góprogramok között, de látványosan demonstrálták, hogy a neurális hálózatok mennyire törékenyek az olyan támadásokkal szemben, amelyek a meghatározott sajátosságaikat próbálják kihasználni. Még a játéktábla korlátozott kontextusában emberfeletti teljesítményt nyújtó modellt is le lehet győzni valamilyen egyszerű, de szokatlan haditervvel.

Az Ars Technica beszámolója a kutatási projekt egyik résztvevőjét idézi, aki szerint az emberek szintjén teljesítő MI-modellek valójában nagyon idegen módokon teszik ezt, amiből az is következik, hogy az emberek számára meglepő módon tudnak meghibásodni. A dolog pedig lehet, hogy a gójátékban szórakoztató, de az már kevésbé lesz vicces, amikor a biztonsági szempontból kritikus mesterségesintelligencia-rendszereket (mondjuk egy önvezető autó MI-jét) is hasonló módon sikerül majd letérdeltetni. A tudósok szerint nagy szükség lenne az automatizált tesztelés javítására, hogy felfedjék a legrosszabb meghibásodások lehetőségeit.

Cloud & big data

Nem csak a Reddit próbálja reklámokkal teleszórni saját platformját

A nemrég tőzsdére vitt vállalkozás új hirdetési formát jelentett be, miközben mások a jutalékot megkerülve igyekeznek átlagos posztként eladni a robotok termelte reklámszöveget.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.