Az Alibaba új technológiája azt mutatja, hogy tényleg közel az idő, amikor bárki különösebb digitális előképzettség nélkül készíthet élethű animációkat – akár valós személyekről is.

Az Alibaba Institute for Intelligent Computing által fejlesztett, Animate Anyone néven hivatkozott MI-modell a cég állítása szerint bármilyen fényképet képes következetesen és megfelelően irányítható módon animálni, praktikusan videókká alakítva a fényképeket a kívánt pózok szekvenciáinak összefűzésével. Ez állítólag nagy lehetőségeket jelent a mesterséges intelligencia által generált ruháktól a tömegesen gyártott, de személyre szabott videók megjelenéséig, bár az állóképes mélyhamisítás (deepfake) tapasztalatai alapján talán az jut legelőször az ember eszébe, hogy innentől még óvatosabbnak kell lennie az internetre kerülő fotóival és arcmásaival.

Az Animate Anyone nem a legelső megoldás ebben a mezőnyben, és egyelőre a tökéletestől is messze van, de a korábbi kísérleteknél meggyőzőbbnek tűnik. A korábbi modellek már bemutatták, hogyan lehet rögzíteni a referenciaként szolgáló fotók fontos részleteit, hogy aztán az eredetitől nem sokban eltérő pózokra képezzék le azokat. Nehezen megoldható problémának tűnt azonban a szöveges alkalmazásokból jól ismert hallucináció, amikor a modelleknek maguktól kellett "kitalálniuk", hogyan festenek az egyes részletek elmozdítva vagy elforgatva – az Animate Anyone ebben fejlődött sokat, bár még nagyban rá van utalva a nézők felületességére.
 


Az Alibaba kutatói szerint az új modell legfontosabb sajátossága, hogy lehetővé teszi a viszonyítási képpel való kapcsolat átfogó megértését egy konzisztens jellemzőtérben (az adatok jellemzésére használt karakterisztikák gyűjteményén), jelentős javulást érve el a megjelenés részleteinek megőrzésében. A fejlesztők GitHub-oldala alapján már dolgoznak a demó és a kód nyilvános kiadásának előkészítésén, egyelőre konkrét megjelenési dátum nélkül. A technológia így még mindenképpen alkalmatlannak tűnik az általános felhasználásraa, de a mesterséges intelligencia fejlődési ütemét tekintve nem sokáig várat magára, hogy az internetet elárasszák a videós hamisítványok.

A Decrypt beszámolója az Animate Anyone kapcsán megemlékezik a némileg eltérő megközelítést alkalmazó MagicAnimate-ről is, amit azonban kevésbé pontosnak ír le, nyilvánvaló deformációkkal a referenciaképhez viszonyítva. A szórakoztatóipari alkalmazások iránti lelkesedést azonban ebben az esetben is beárnyékolják a digitális adatvédelem és a rosszindulatú felhasználások miatti aggodalmak, különös tekintettel az MI-eszközök szerepére a félretájékoztatásban. Mivel az ilyen eszközök hozzáférhetősége a jövőben csak növekedhet, egyre nagyobb figyelmet kap az olyan szabályok és előírások kidolgozása, amelyek biztonságosabbá teszik az új technológiát.

a kép forrása: arxiv.org

Konzumer tech

Több mint félszázezer műholddal sűrítené az égboltot Bezos cége

A Blue Origin amerikai hatóságokhoz beadott kérelme szerint akár 51 600 szatellitből is állhat a vállalt tervezett adatközpontos űrflottája.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.