Akármilyen látványosan is fejlődnek a mesterségesintelligencia-alkalmazások, a teljesítményüket a betanításukhoz használt adatok határozzák meg, vagyis amit nem tudnak, azt jellemzően később sem fogják tudni. Az ismeretlen környezetekhez és helyzetekhez való alkalmazkodást segítheti, ha kérdéseket tesznek fel, azonban hiányzik az a képességük, hogy ebben is a változó környezethez igazodjanak. Az emberek esetében társadalmi vagy szociális tanulásnak nevezik az olyan ismeretek és viselkedések elsajátítását, amelyek segítik a beilleszkedést és a csoportokon belüli hatékony működést – ennek keretei között pedig, az MI terminológiáját használva, a megfelelő kérdéseket teszik fel természetes nyelven, hogy tudásukat a kiképzésük alapjául szolgáló adatkészleteken túl bővítsék.
A Stanford Egyetem kutatói által kifejlesztett ágens ezzel a szemlélettel terelné új útra a gépi tanulást, ötvözve a gépi látás (computer vision) és az emberi viselkedéstudományok megközelítését. Ahogy a Venture Beat riportjából kiderül, a "szociálisan tudatos MI" már ahhoz is képes lenne igazodni, amikor az emberek vonakodnak a leegyszerűsítőnek vagy túl hétköznapinak tartott kérdések megválaszolásától. A cikkben idézett példa alapján egy ismeretlen négylábú fényképének elemzésekor az MI megkérdezheti, hogy "Miféle állat ez?", de ha erre nem kap választ, netán még el is kezdenek vele gúnyolódni, akkor változtat a kérdésen. És ha úgy próbálkozik, hogy "Csak nem egy kutyát látok?", akkor nagyobb valószínűséggel világosítják fel róla, hogy a kép valójában egy szarvast ábrázol.
A cél az ember-gép interakció fejlesztése
A dolog banálisan hangzik, de a kutatók szerint az emberek hajlandósága minimum változékony a komoly válaszadásra, ezért nagyon fontos, hogy a mesterséges intelligencia megtanulja olvasni a társadalmi normákat. A tesztek során az új algoritmus nyolc hónapon keresztül elemzett képeket egy képmegosztásra szolgáló közösségi platformon, és 236 ezer embert (nagyrészt fotósokat) kérdezgetett velük kapcsolatban. A kísérlet eredményeként pedig több mint kétszeresére növelte a hatékonyságát abban, hogy felismerje az új vizuális információt, vagyis értelmezhető módon lépte át a gépi intelligencia tanulásának ilyen irányú korlátait. A fejlesztők szerint ráadásul az új megközelítés általában is lehetőséget teremt majd az MI számára, hogy felismerje saját antiszociális viselkedését.
A jelenlegi képzési módszerek egy másik hátrányának egyébként azt tartják, hogy bármilyen adatokkal is etetik a mesterséges intelligenciát, azokat először emberi közreműködéssel kell felcímkézni, de az annotátorokat sem könnyű rávenni a rutinszerű tartalom jelölgetésére. Az új ágens ezt a problémát is kiküszöbölheti, ha megtanul úgy kérdezni, hogy komoly és őszinte válaszokat kapjon. Az olyan eseteket elkerülendő, amikor a válaszadók koordinált módon torzítjá el a modelleket, itt a program döntené el, hogy kivel lép kapcsolatba, mérsékelve az elfogultságból eredő kockázatokat. A következő lépés pedig a megoldás valós helyzetekbe való átültetése lenne, amikor a felhasználók már menet közben javíthatják a robotokat, ha azok hibát követnek el.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak