A kutatók a mesterséges intelligencia jelenleg erősen korlátozott képességeit próbálják kiszélesíteni azzal, hogy a gépi játékosoknak nem egy-egy konkrét játékban kell minél jobban szerepelni.

A Google által 2014-ben felvásárolt DeepMind kutatói az elmúlt évtizedben sorra szállították a mesterséges intelligenciához köthető újabb és újabb nagyszerű eredményeket. A korábbi években beszámoltunk például arról, amikor a deep Q-networknek nevezett algoritmus végigjátszotta a számítógépes őskorszak ikonikus darabjára, az Atari 2600-ra írt félszáz játékot, vagy amikor az ugyancsak a DeepMind által fejlesztett AlphaGo legyőzte az egyik legerősebb profi gójátékost. Vagy ott van az AlphaZero, amely mindenféle megnyitáselmélet és adatbázis nélkül képes volt pár nap alatt úgy megtanulni sakkozni, hogy nem csak az emberi játékosokat, de a legerősebb gépi riválisokat is térdre kényszerítette. Két évvel ezelőtt pedig már olyan lazábban szabályozott környezetben is diadalmaskodott profik felett a cég MI-je, mint amilyet a legendás valós idejű stratégia játék, a StarCraft II nyújt.

Bármennyire is meggyőzőek ezek az eredmények, a mesterséges intelligencia jelenlegi korlátait szépen kidomborítja az, hogy a fenti esetek mindegyikében egyfajta célprogramként funkcionált az MI. Azaz a góban diadalmaskodó algoritmus nem tudna mit kezdeni egy sakkjátszmával, és viszont. A kutatók szent grálja viszont természetesen egy olyan MI megalkotásában ölt testet, amelyik a környezeti feltételektől és a "játékszabályoktól" függetlenül képes értékelhető döntéseket hozni.

Minden körülmények között

Az általános gépi intelligencia felé vezető út egyik lépése lehet az a virtuális játszótér, amely folyamatosan változó körülményekkel és szabályokkal próbálja az egyes algoritmusokat adaptálódásra tanítani. Az XLand elnevezésű színes világban egy központi algoritmus felelős a terep és az adott szituációban érvényes szabályok megalkotásáért. A játékos szerepre osztott MI-k arzenálja pedig mindössze annyiból áll, hogy képesek érzékelni a különböző színeket, illetve megkapják a jutalompont megszerzésének feltételeit. Minden más a térképen mozogva dől el.
 

 

A megerősítéses tanulással pallérozódó virtuális játékosokat a szintén a korábbi tapasztalatokból fejlődő játékmester folyamatosan újabb és újabb, egyre összetettebb kihívások elé állítja. Ezek között egyaránt vannak együttműködést igénylő és kompetitív célok, miközben a játékban részt vevő MI-k száma is állandóan változik.

A DeepMind által "nevelgetett" algoritmusok között van olyan, amelyik már 700 ezer különböző partiban vett részt 4000 egyedi terepen. Ezekben a játékokban pedig összesen 3,4 millió különböző feladattal kellett megbirkóznia. Az MI ezeket a célokat folyamatos próbálkozással igyekszik letudni. Bár abban egyelőre maguk a kutatók sem biztosak, hogy mekkora a szerencse szerepe abban, ha például egy elemnek ütközve az MI új, eddig nem létező közlekedési utat nyit magának a pályán, ám az ilyen haladást segítő "balesetek" előfordulása meglehetősen konzisztensnek mutatkozik.

Van még mit tanulni

Az úgynevezett open-ended learning módszer finomításától a cég szakemberei azt remélik, hogy idővel sokkal több területen használható, eszköztárát rugalmasan alakító algoritmusok segíthetik majd életünket. Ám ehhez még bizonyosan van mit tanulni, hiszen a fenti videóban is bemutatnak olyan, elméletben együttműködést kívánó játszmát, ahol az algoritmusok összedolgozás helyett inkább egymás "legyilkolásában" látják a megoldás kulcsát.

Cloud & big data

Jövőre most már tényleg jöhet a Google okosórája

A keresőóriás saját gyártású órájáról évek óta tartó pletykák idén felerősödtek. A legutóbbi értesülések alapján a projekt jól halad, és akár már 2022 tavaszán debütálhat a referenciaként funkcionáló eszköz.
 
Hirdetés

Viszlát, nyolcórás munkarend!

A járvány miatti kényszerű lezárások új alapokra helyezték a munka világát is, ami már nem lesz olyan, mint azelőtt.

A cloud computing fontos ígérete, hogy pontosan tervezhetővé teszi az IT költségeit. Akkor miért nem annyi hónap végén a számla, amennyit beterveztünk?

a melléklet támogatója az Invitech

A KPMG immár 22. alkalommal kiadott CIO Survey jelentése szerint idén az informatikai vezetők leginkább a digitalizációra, a biztonságra és a szoftverszolgáltatásokra koncentráltak.

Használtszoftver-kereskedelem a Brexit után

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.