A legokosabb MI is meglepően ostoba, ha rájátszanak a gyengeségeire

Bitport2022.11.26.Cloud & big data

Egy új algoritmus olyan lépésekkel győzi le a gójátékban a legmenőbb MI-modellt, amelyekkel egy közepes emberi játékostól simán kikapna.

A mélytanuló mesterséges intelligencia fejlődésében hatalmas mérföldkőnek tartják, hogy 2016-ban a gójátékban is sikerült megtörni az emberek felsőbbségét. A DeepMind AlphaGo programja mélytanuló neurális hálózatokat használt, hogy olyan szinten sajátítsa el a gót, amivel már a legmagasabban jegyzett játékosok sem tudtak lépést tartani. A rendszer egy következő, AlphaGo Zero nevű változata pedig arra is képes volt, hogy külső segítség nélkül, saját maga ellen játszva tanulja meg a játékot, és mindössze háromnapos felkészülés után 100-0 arányban rommá verje az Alpha Go korábbi, emberi bajnokokat legyőző verzióját.

Mindezzel kapcsolatban a legújabb érekesség, hogy az MIT, a UC Berkeley és a Fund for Alignment Research kutatói sikeresen tanítottak be egy mesterségesintelligencia-modellt a gójátékban egy ideje a legerősebbnek tartott MI-program, a KataGo legyőzésére. A nyílt forrású KataGo az AlphaGo alapjaira épül, de olyan további megoldásokat is felvonultat, amelyek segítségével annál is hatékonyabbá tették a rendszer tanulását. Így az eredmény már önmagában szót érdemelne, de a lényeg most nem az, hogy megszületett volna egy erősebb kihívó, hanem az, hogy tulajdonképpen a KataGo elleni célzott támadást vittek sikerre.

Nem emberiek sem az erősségeik, sem a gyengeségeik

A trükk lényege, hogy a tudósok által felkészített rendszer képes rávenni a KataGót, hogy idő előtt úgy értékelje, megnyerte a mérkőzést. Emiatt a KataGo passzol (a góban egy bizonyos ponton túl a győztes játékosnak nincs értelme további lépéseket tennie), az ellenfele pedig csak erre vár, és szintén passzol. A szabályok szerint ilyenkor azonnal vége a játéknak, amit KataGo így jó eséllyel el is veszít. A kutatók által kiképzett neurális hálózat tehát a KataGo stratégiájában lévő lyukakra specializálódott ahelyett, hogy erős gójátékossá fejlődött volna: a jóindulattal is csak közepes emberi játékosok például gond nélkül meg tudják verni.

Fontos tisztázni, hogy a szóban forgó amatőrök nem tudják legyőzni KataGót a modell által alkalmazott stratégiájával, így nem is maga a stratégia a lényeges a dologban, hanem a képesség a KataGo konkrét hibáinak kihasználására. Összességében tehát nem avattak új bajnokot a góprogramok között, de látványosan demonstrálták, hogy a neurális hálózatok mennyire törékenyek az olyan támadásokkal szemben, amelyek a meghatározott sajátosságaikat próbálják kihasználni. Még a játéktábla korlátozott kontextusában emberfeletti teljesítményt nyújtó modellt is le lehet győzni valamilyen egyszerű, de szokatlan haditervvel.

Az Ars Technica beszámolója a kutatási projekt egyik résztvevőjét idézi, aki szerint az emberek szintjén teljesítő MI-modellek valójában nagyon idegen módokon teszik ezt, amiből az is következik, hogy az emberek számára meglepő módon tudnak meghibásodni. A dolog pedig lehet, hogy a gójátékban szórakoztató, de az már kevésbé lesz vicces, amikor a biztonsági szempontból kritikus mesterségesintelligencia-rendszereket (mondjuk egy önvezető autó MI-jét) is hasonló módon sikerül majd letérdeltetni. A tudósok szerint nagy szükség lenne az automatizált tesztelés javítására, hogy felfedjék a legrosszabb meghibásodások lehetőségeit.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Egy 2018 óta húzódó ügy végére került pont tegnap azzal, hogy az Európai Unió Bírósága tegnap helyben hagyta a versenykorlátozó intézkedések miatt a Google-re kiszabott 4,1 milliárd eurós EU-s bírságot.

A hónap témája

Túl a költségcsökkentésen - felnőtt a felhő

A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Túl a költségcsökkentésen - felnőtt a felhő

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!