Már működik a Google szövegekből videókat generáló neurális hálózata, az Imagen Video, de a problémás tartalommal még nem mindig tud mit kezdeni, ezért egyelőre nem is teszik széles körben hozzáférhetővé.
Hirdetés
 

A Google egy tavasszal publikált tanulmányban mutatta be a szövegből élethű képeket gyártó Imagen képgenerátort, amelynek képességeiről azóta a felhasználók is megbizonyosodhattak. Ennek mozgóképes változata, az Imagen Video október elején mutatkozott be, amikor néhűnx nappal ezelőtt újabb cikk jelent meg a mesterséges intelligencia elképesztő szöveg-videó generálási képességeiről. Ennek alapján az algoritmus már 3D-s modelleket és rövid animációkat is képes alkotni, az anyagból azonban az is kideül, hogy a gyártó "számos fontos biztonsági és etikai kihívásra" hivatkozva egyelőre nem kívánja nyilvánossá tenni a megoldást.

Eszerint az Imagen Video rendszerét, illetve annak szöveges enkóderét a problémásnak nevezett adatokra is betanították, és bár a Google belső tesztjei szerint a nyílt és erőszakos tartalom nagy része azonosítható, továbbra is léteznek olyan "társadalmi elfogultságok és sztereotípiák", amelyeket nehéz felismerni és kiszűrni. Egyszerűbben fogalmazva, az MIsegítségével olyan videókat lehet generálni, amelyeknek szexuális, erőszakos vagy rasszista tartalma nem illik a techvállalat imázsához, így a modellt és annak forráskódját nem teszik közzé, ameddig ezen a területen nem sikerül megnyugtató megoldásokat találniuk.

A kockázatot ismerik, a megoldást még nem

A kommentárok szerint ez az újabb eset is rávilágít a gépi tanulás izgalmas valóságára, amennyiben a kutatók nem ritkán rendkívüli eredményeket produkáló modelleket fejlesztenek (az Imagen képei már a korábbi bemutatók alapján is lenyűgözőek), de nem igazán boldogulnak a lehetséges kimenetek ellenőrzésével. Ehhez hasonló problémákat más neurális hálózatokkal kapcsolatban is tapasztaltak, ahol pontosan azok a jelenségek jöttek elő, amelyekről a Google a mostani anyagában is ír, az Imagen pedig egy új elemmel gazdagítja a palettát, mivel a szövegből generált videók a közelmúltig nem voltak lehetségesek.

A Google cikének konklúziójában mindenesetre kiemelik, hogy a videós modellezés nagy számítási igényű dolog, amelyben értékes új technikát alkalmaznak a mintavételi folyamat felgyorsítására. Tekintettel a generatív modellezés terén a közelmúltban elért óriási előrehaladásra, a vállalat tudósai úgy láták, hogy a jövőben még bőven lesz lehetőségük a mesterséges intelligenciára épülő videógenerálás továbbfejlesztésére – bár úgy tűnik, hogy a fejlesztések közkinccsé tételéhez legalább ilyen fontos lesz a szóban forgó biztonsági és etikai kihívások leküzdése is. Ahogy írják, a generatív modellek alkalmasak a hamis, gyűlöletkeltő, explicit vagy káros tartalom generálására is, amit egyelőre a bemeneti szövegek és a kimeneti videótartalom szűrésével próbálnak korlátozni.

Cloud & big data

Az MI-adatközpontok építői is az indiánok földjére pályáznak

A mesterséges intelligenciát fűtő infrastruktúra erőltetett ütemű kiépítése újabb fejezetet nyitott az őslakos közösségek kizsákmányolásának történetében, de a hírek szerint itt-ott már az ellenállás is éledezik.
 
Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.