A Kínában tartott World Internet Conference egyik idei attrakciója volt a Xinhua állami hírügynökség és a Tencent érdekeltségébe tartozó Sogou közösen bemutatott fejlesztése, egy MI-alapú robot hírolvasó, amelynek célja az emberi arckifejezések és manírok leutánzása. A valódi, Kínában jól ismert hírolvasokról mintázott avatárok ebben a pillanatban inkább csak látványosságnak számítanak, de hatékonyan demózták azokat az erőfeszítéseket, amelyek eredményeképpen Kína másfél évtizeden belül vezető technológiai szerepre törne a mesterséges intelligencia területén, legyen szó bármilyen felhasználásról a megfigyelő rendszerektől vagy az autonóm járművekig.
A robot hírolvasó stílszerűen azzal köszöntötte a látogatókat, hogy ez az első napja a munkahelyén, és innentől fáradhatatlanul, 0-24 órában tájékoztatja majd a nézőket egészen addig, amíg folyamatosan töltik a rendszerébe a híreket és információkat. Arról egyelőre nem szólnak a hírek, hogy a megoldást mikor vetik be élesben, a valódi televíziós adásokban, de erre valószínűleg már nem kell sokat várni: a mesterséges tévések, szemben például a játékokból ismert 3D-s figurákkal, valóban fotórealisztikus animációk, a Xinhua szerint pedig jelentős költségcsökkentést ígérnek a hírműsorok gyártásában is.
Nagyon élethű, és pont emiatt idegesítő
A technológia ezzel együtt még közel sem tökéletes. Ahogy arra sokan felhívják a figyelmet, a robot hírolvasó iskolapéldája a digitális fejlesztésekből jól ismert, "uncanny valley" nevű jelenségnek, ami a teljesen élethű és az absztrakt tartalom közti megjelenítési szürke zóna. A tapasztalat szerint az emberi agy képes elfogadni, ha egy digitális modell csak 80 százalékos pontossággal adja vissza a valóságot, a majdnem élethű (mondjuk 95 százalékos) hasonlóság viszont kellemetlen érzéseket, szorongást kelt, és egy ilyen figura semmiképpen sem lesz szerethető – ami egy tévés személyiség vagy avatár esetében pedig fontos feltétel lenne.
A BBC beszámolójában megszólaltatott egyetemi kutatók szerint a Xinhua modellje ebben a pillanatban lapos, nincs ritmusa és nincsenek benne megfelelő hangsúlyok sem, emiatt nehéz néhány percnél tovább nézni. Ezzel együtt megjegyzik, hogy a technológia minden bizonnyal gyors fejlődés előtt áll, de ebben a pillanatban még nem alkalmas rá, hogy megtartsa a kontaktust a nézőkkel – és az sem biztos, hogy ez belátható időn belül sikerülni fog neki azon a szinten, mint egy emberi hírolvasónak.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak