Ahogy az várható volt, a napokban tartott Computexen résztvevő cégek mindegyike igyekszik meglovagolni a mesterséges intelligencia körül kerekedett felhajtást. A Qualcomm mellett így tett az Nvidia is, amely egy sor bejelentéssel próbálta erősíteni pozícióját az öldöklő MI-versenyben.
A generatív algoritmusok egyik lehetséges hasznosítására az Nvidia egy számára kedves területet, a játékipart pécézte ki. A technológiai seregszemlére időzítve mutatkozott be az Avatar Cloud Engine (ACE), amely több fejlett technológiai megoldást gyúr egybe annak érdekében, hogy a játékosok korábban nem látott szinten merülhessenek el a kitalált történetekben.
Az alábbi demóban épp ott kapcsolódunk be a sztoriba, hogy főhősünk egy futurisztikus stílusú japán étterembe toppan, ahol szóba elegyedik a tulajjal (utóbbi egy nem játékos karakter, azaz angol terminológiával NPC). Némi kérdés-felelek után kiderül, hogy az üzletmenetnek nem tesz jót a bűnbandák ténykedése, és ha segíteni szeretnénk, keressük meg a helyi jakuzafőnököt egy kis elbeszélgetésre.
Az elhangzó beszélgetés ugyan nem esélyes irodalmi Nobel-díjra, ám abból a szempontból egészen koherens, hogy ezt az algoritmus valós időben alkotta meg, azaz nem kapott szövegkönyvet, előre fixált vagy opcionálisan bevethető sablonválaszokat.
A Jin nevű étteremtulajdonos NPC azonban nem csupán egy ChatGPT-hez hasonló képességekkel bíró, a játék történetére szabott chatbot. A demózott rendszer fontos része a felhasználó hangját szöveggé alakító modul, illetve a megjelenített karakter arcmozgását az éppen elhangzottakhoz alakító technika is. Ez teszi lehetővé, hogy a játékos valódi szabadságot élvezhessen a történetben szereplő karakterekkel való kommunikáció során. A korábbiakban megszokotthoz képest nem kell már néhány előre generált mondatból válogatni, elég csak kimondania, amit gondol, vagy megkérdeznie, amire kíváncsi.
A NeMO elnevezésű, testreszabható nagyméretű nyelvi modell, a Riva beszédfelismerő és szöveggeneráló eszköz és az NVIDIA Omniverse Audio2Face munkájához az Unreal Engine 5-ben készült helyszín szolgáltatja a minőségi látványt.
Hisszük, ha játsszuk
Bár a bemutatóban alkalmazott elemek egy része már most is használatban van, illetve azokkal éppen zajlanak játékfejlesztési munkák (a Stalker 2: Heart of Chernobyl például támaszkodik az Audio2Face-re), a teljes rendszer éles bevetése lesz majd a puding igazi próbája.
Mert ami egy előre rögzített demóban elég jól működik, az a valóságban könnyen félrecsúszhat. A nem tökéletes kiejtés, a szenzorok számára nehezebben követhető hanglejtés, vagy éppen egy félreérthető kifejezés könnyen megakaszthatja az MI fogaskerekeit, amiből aztán tökéletes beleélés helyett csak felesleges frusztráció kerekedik.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?