Amilyen léptekkel haladnak a fejlesztések, egyre nehezebb olyasmivel előállni a generatív mesterséges intelligencia témájában, amire az ember felkapja a fejét. Bizonyos szempontból ilyesmi sikerült a Google kutatóinak, akik Vlogger elnevezésű modelljüket arra képezték ki, hogy egyetlen állóképből és egy csatolt hanganyagból mozgó, hihetően animált videót készítsen.
A csapat által kiadott tanulmány (PDF) szerint Vlogger nem más, mint egy "újszerű keretrendszer az emberek hangból történő szintetizálására", célja pedig egy olyan avatar megalkotása, amely képes támogatni "az emberi felhasználóval folytatott beszélgetéseket".
Image to Video Generation:
— Roni Rahman (@heyronir) March 19, 2024
Here are more examples of talking face generation using just a single input image and driving audio. pic.twitter.com/7bZUkIxhVi
A kutatók szerint mindezt remekül fel lehetne használni "az online kommunikáció, az oktatás vagy a személyre szabott virtuális asszisztensek fejlesztésénél". A Vlogger ráadásul felvételek autmatikus szerkesztésére is képes. Például az angolul elmondott szöveget spanyolra teszi át úgy, hogy a beszélő szájmozgása is ennek megfelelően változik.
Kockázatok és mellékhatások
Bár a fenti kisfilmeken alaposabb vagy közelebbi vizsgálat után mind felfedezhetők a generált tartalmakra jellemző hibák és "embertelenségek", az kétségtelen, hogy a technológia már most is képes a felületes szemlélőt megtéveszteni. Utóbbi pedig borítékolhatóan arra ösztönöz egyes embereket, hogy saját nemtelen céljaikra használják fel a kezükbe pottyant eszközöket.
Bizonyítékként ott vannak a deepfake-ként emlegetett személyiséglopások és csalások, amelyek a technológia fejlődésével egyre kifinomultabbá válnak. Ott vannak például a gyerek hangjával terrorizáló modern unokázós csalók, de nemrégiben ennek lett áldozata Taylor Swift is.
(Fotó: Google Research)
Exkluzív szakmai nap a felhők fölött: KYOCERA Roadshow a MOL Toronyban
A jövő irodája már nem a jövő – hanem a jelen. A digitális transzformáció új korszakába lépünk, és ebben a KYOCERA nemcsak követi, hanem formálja is az irányt. Most itt a lehetőség, hogy első kézből ismerje meg a legújabb hardveres és szoftveres fejlesztéseket, amelyekkel a KYOCERA új szintre emeli a dokumentumkezelést és az üzleti hatékonyságot.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak