Ismét bizonyságot nyert, mennyire zseniális Rubik Ernő találmánya, a bűvös kocka. Gépi tanuláshoz használta fel egy kutatócsoport, hogy autodidakta gépi tanulási (ML – machine learning) algoritmust fejlesszen. A Rubik-kocka a Góhoz vagy a sakkhoz képest egyszerűbb, és viszonylag egyszerű olyan algoritmust írni, amely villámgyorsan megadja egy véletlenszerűen megkevert kocka leggyorsabb megoldását.
De mi van akkor, ha nem mondjuk meg a ML-nek, hogy milyen szabályok mentén kell megoldani a feladatot?
Új lépcsőfok a mesterséges intelligenciában
A Kaliforniai Egyetem egy kutatócsapata a bűvös kocka segítségével kísérletezett autodidakta ML létrehozásával. (Akit a sikeres kísérlet matematikai háttere érdekel, itt találja a kutatócsoport tudományos publikációját.)
De hol itt az újdonság? Hiszen annak idején mi is megírtuk, hogy a Google AlphaGo Zero úgy győzte le a korábban a legerősebb go-játékosokat legyőző AlphaGo-t, hogy a szabályok ismeretében kizárólag magától tanult véletlenszerű partikkal három napig. Aztán hamarosan a sakkal is eljátszották ugyanezt: az AlphaGo Zerónak indössze négy óra kellett, hogy a világ legerősebb sakkgépét nullára verje.
A Kaliforniai Egyetem csapatának egy lépéssel sikerült messzebb jutnia – igaz, egyelőre a gónál jóval egyszerűbb probléma esetében.
Jobb átlagot hoz, mint az ember
A kutatócsoport autodidakta iterációnak nevezi azt a tanulási algoritmust, amellyel az ML képes megtanítani magát, hogyan kell megoldani a problémát. Állításuk szerint az autodidakta tanulás olyan hatékony, hogy a véletlenszerűen megkevert kockát 100 százalékban ki tudja rakni maximum 30, de többnyire kevesebb lépésben. Összességében jobb átlagot képes hozni, mint a profi kockázók többségét, ugyanakkor a kaliforniaiak ML-je egy 30-as eredménnyel nem kerülne be a világ legjobb száz versenyzője közé, ahhoz maximum 25 fogatás kell – a legjobb magyar eredmény 21 forgatás. (A 3×3-as kocka világrekordja egyébként 19 lépés, ezt egy kínai versenyzőnek sikerült elérnie idén április végén, egy pekingi versenyen.)
Az újdonság az, hogy a kutatócsapat már szabályokat sem határozott meg, csak az elérendő végeredményt, hogy a kocka minden oldalának 3×3 egyszínű négyzetből kell állnia. A tanulási folyamat ebből a végeredményből lényegében visszafelé történik. Az ML a végeredmény eléréséhez keresi meg a szabályokat és tanulja meg a legjobb lépéseket.
A kutatócsapat most a módszer továbbfejlesztésén dolgozik összetettebb, azaz nehezebben kirakható kockákkal. De a végeredmény az ML egy általánosabb alkalmazásához is hozzásegítheti a kutatókat. Ilyen probléma a kaliforniai kutatócsapat szerint például a fehérjék feltekeredésének problémája (A fehérjék feltekeredése – szaknyelven folding – az a folyamat, amelynek során a proteinek elnyerik a rájuk jellemző térbeli szerkezetet. Ez az élet egyik nagyon fontos eleme, ugyanis csak ebben a feltekeredett formában tudják ellátni funkciójukat.)
Végezetül egy videó arról, hol tartott a tudomány tíz évvel ezelőtt, ha Rubik-kockáról volt szó:
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak