MI-alapú animált hírolvasókkal villantott a Xinhua hírügynökség. A technológia látványos, de a tökéletességtől még messze van.

A Kínában tartott World Internet Conference egyik idei attrakciója volt a Xinhua állami hírügynökség és a Tencent érdekeltségébe tartozó Sogou közösen bemutatott fejlesztése, egy MI-alapú robot hírolvasó, amelynek célja az emberi arckifejezések és manírok leutánzása. A valódi, Kínában jól ismert hírolvasokról mintázott avatárok ebben a pillanatban inkább csak látványosságnak számítanak, de hatékonyan demózták azokat az erőfeszítéseket, amelyek eredményeképpen Kína másfél évtizeden belül vezető technológiai szerepre törne a mesterséges intelligencia területén, legyen szó bármilyen felhasználásról a megfigyelő rendszerektől vagy az autonóm járművekig.

A robot hírolvasó stílszerűen azzal köszöntötte a látogatókat, hogy ez az első napja a munkahelyén, és innentől fáradhatatlanul, 0-24 órában tájékoztatja majd a nézőket egészen addig, amíg folyamatosan töltik a rendszerébe a híreket és információkat. Arról egyelőre nem szólnak a hírek, hogy a megoldást mikor vetik be élesben, a valódi televíziós adásokban, de erre valószínűleg már nem kell sokat várni: a mesterséges tévések, szemben például a játékokból ismert 3D-s figurákkal, valóban fotórealisztikus animációk, a Xinhua szerint pedig jelentős költségcsökkentést ígérnek a hírműsorok gyártásában is.

Nagyon élethű, és pont emiatt idegesítő

A technológia ezzel együtt még közel sem tökéletes. Ahogy arra sokan felhívják a figyelmet, a robot hírolvasó iskolapéldája a digitális fejlesztésekből jól ismert, "uncanny valley" nevű jelenségnek, ami a teljesen élethű és az absztrakt tartalom közti megjelenítési szürke zóna. A tapasztalat szerint az emberi agy képes elfogadni, ha egy digitális modell csak 80 százalékos pontossággal adja vissza a valóságot, a majdnem élethű (mondjuk 95 százalékos) hasonlóság viszont kellemetlen érzéseket, szorongást kelt, és egy ilyen figura semmiképpen sem lesz szerethető – ami egy tévés személyiség vagy avatár esetében pedig fontos feltétel lenne.
 


A BBC beszámolójában megszólaltatott egyetemi kutatók szerint a Xinhua modellje ebben a pillanatban lapos, nincs ritmusa és nincsenek benne megfelelő hangsúlyok sem, emiatt nehéz néhány percnél tovább nézni. Ezzel együtt megjegyzik, hogy a technológia minden bizonnyal gyors fejlődés előtt áll, de ebben a pillanatban még nem alkalmas rá, hogy megtartsa a kontaktust a nézőkkel – és az sem biztos, hogy ez belátható időn belül sikerülni fog neki azon a szinten, mint egy emberi hírolvasónak.

Sztrájkba kezdenek a videójátékok szinkronszínészei az MI miatt

A hollywoodi színészek és a játékkészítő stúdiók képviselői közel álltak a megállapodáshoz, ám a generatív algoritmusok jelentette problémákat egyelőre nem sikerült megnyugtatóan rendezni.
 
Általános jelenség a hazai nagyvállalatok körében, hogy a szükségesnél jelentősen többet költenek nyilvánosfelhő-szolgáltatásokra. Utánajártunk, mi a pontos helyzet, és mit lehet tenni a költségek optimalizálásáért.

a melléklet támogatója a 4iG Nyrt.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.