Átlépte az emberi felfogás korlátait a DeepMind mesterséges intelligenciája

Tököli Gábor2017.10.19.Cloud & big data

Az AlphaGo legújabb változata külső segítség nélkül, három napos tanulás után verte rommá a saját korábbi, a legjobb humán játékosokat is felülmúló változatát.

Már másfél éve, hogy az Alphabet DeepMind részlege által fejlesztett AlphaGo mesterséges intelligencia legyőzte a világ egyik legmagasabban jegyzett gójátékosát, a profi 9 danos dél-koreai I Szedolt. Ez igen látványos sikernek számított az MI-k evolúciójában, tekintve, hogy a gójátékon eddig nem sikerült a gépek számítási kapacitásának növelésével felülkerekedni. A DeepMind azonban új megközelítést alkalmazott a rendszer ideghálót modellező felépítésével és a sztochasztikus keresés kombinációjával.

Stratégiai kérdés lett az MI-k fejlesztése

Még a közelmúltban is az volt a helyzet, hogy a legjobb góprogramokat is simán elverte egy-egy ügyesebb amatőr játékos, és a többség meg volt róla győződve, hogy a sakk húsz évvel ezelőtti varázstalanítására a gó esetében csak távoli jövőben kerülhet sor. Az AlphaGo idén májusban újabb trófeát szerzett: következő áldozata az ugyancsak 9 danos kínai Ko Csie, az aktuális világranglista vezetője volt, amia gójátékot feltaláló nemzet szemében minimum felért egy mexikói null-hattal.

Ahogy arról a The New York Times információi alapján mi is beszámoltunk, ez a vereség adhatta meg a végső lökést a kínai politikának is, hogy halálosan komolyan vegye az MI-fejlesztésekben rejlő lehetőségeket, és az eddigieknél is komolyabb állami forrásokat biztosítson a jövő világgazdasági dominanciáját megalapozó fejlesztésekhez. (Donald Trump ezzel szemben éppen lefaragja a tudományos kutatások támogatását, így az MI-kutatásokat finanszírozó állami szervezetek költségvetését is.)

Februárban egyébként egy másik játék is kapitulált a mesterséges intelligencia előtt: a Carnegie Mellon University kutatói által fejlesztett Libratus egy húsz napos, no-limit heads-up Texas hold'em pókerversenyt nyert meg, négy versenyzőt is maga mögé utasítva a világ legelismertebb pókerjátékosai közül. A póker bizonyos szempontból a játékok legvégső határának számít, mivel a Jeopardy-val, a sakkal vagy akár a góval szemben hiányos információra épülő döntésekről szól.

Már nem az AlphaGo a legnagyobb király

Visszatérve a góhoz, a DeepMind programja tegnap került be ismét a hírekbe, ezúttal azonban a rendszer veresége jelentette az Alphabet kutatóinak sikerét. A rendszer legújabb, AlphaGo Zero nevű változata 100-0 arányban verte meg az Alpha Go korábbi, a dél-koreai profit is legyőző verzióját. Mindez ráadásul úgy sikerült neki, hogy mindössze három nappal azelőtt ismerkedett meg a játékkal, és tudását csak a maga ellen játszott, kezdetben még véletlenszerű gyakorló mérkőzéseken tökéletesítette.

Ez azért különösen érdekes, mert a korábbi változat a szofisztikált működés mellett még nagyban támaszkodott az emberi tudásra és tapasztalatokra, hiszen százezres nagyságrendben elemezte ki a legjobb humán játékosok játszmáit. Az AlphaGo Zero ezzel szemben kizárólag saját magától tanul, és nem csak a "Lee" változat szintjét múlja felül három nap alatt, de huszonegy nap alatt arra is képes, hogy meghaladja a januárban elérhetővé tett AlphaGo Master játékerejét is. (Ez a változat zsinórban 60 partit nyert meg azóta különböző topjátékosok ellen.)

A DeepMind alapító vezérigazgatója, Demis Hassabis szerint a továbbfejlesztett neurális hálózat és a hatékony keresőalgoritmus kombinációja tulajdonképpen magát fejlesztve állítja elő az AlphaGo egyre magasabb szintű változatait. A tanulási folyamat ebben az esetben már semmilyen módon nem támaszkodik az emberi megismerésre: a folyamat a nulláról indul, és a rendszer kizárólag a legerősebb gójátékostól tanul, vagyis saját magától.

A játék csak felkészülés a valódi kihívásokra

Hassabis úgy látja, hogy ha a mesterséges intelligencia ilyen jól teljesít egy annyira komplikált területen, mint amilyen a gó, akkor ideje, hogy ráküldjék az emberiség legnagyobb kihívást jelentő és meghatározó jelentőségű problémáira. Ilyen lehet például az összetett fehérjék tanulmányozása, ahol már a közeljövőben nagy áttöréseket várnak az MI-től az Alzheimer-kór, a Parkinson-kór vagy mondjuk a cisztás fibrózis gyógyításának kutatásában, akár több száz évvel is megelőzve a humán kutatók saját erejéből várható eredményeit.

A DeepMind kutatói jelenleg a StarCraft II valós idejű stratégiai játékra trenírozzák az AlphaGo rendszerét, ahol egy új, kép alapú interfész segítségével dolgozzák fel az alacsony felbontású RGB képadatokat. A szakemberek szerint a StarCraft működése jól modellezi a valós fizikai környezet folyamatait, legalábbis a tanulásnak ezen a szintjén. Az ágenseknek elvileg ugyanazokkal a tulajdonságokkal kell rendelkezniük, hogy sikereket érjenek el a játékban, mint amelyekre akkor is szükségük lesz, ha később a való világban kell betanítani őket a különféle feladatokra.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hamarosan jóval drágább lesz a digitális életünk

Áremelésre készülnek a szerver- és PC-gyártók, és áremelésre készül a Microsoft is. Mindenkinek megvan a nyomós érve, hogy miért.

A hónap témája

Hogyan lett a riportolásból döntésautomatizálás?

Az üzleti intelligencia sokáig a múltban történtek értékelésről szólt. Napjainkban viszont már inkább az a kérdés, hogy mi történik holnap; különösen akkor, ha módosítjuk a vállalati működés valamelyik paraméterét.

a melléklet támogatója a One Solutions

CIO Podcast

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

CIO Podcast #66: A DÁP projekt és a piac. A szembesítés félórája

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hamarosan jóval drágább lesz a digitális életünk

Hogyan lett a riportolásból döntésautomatizálás?

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia