Erőszak, pornó és rasszizmus veti vissza a Google új technológiáját

Bitport2022.10.12.Cloud & big data

Már működik a Google szövegekből videókat generáló neurális hálózata, az Imagen Video, de a problémás tartalommal még nem mindig tud mit kezdeni, ezért egyelőre nem is teszik széles körben hozzáférhetővé.

A Google egy tavasszal publikált tanulmányban mutatta be a szövegből élethű képeket gyártó Imagen képgenerátort, amelynek képességeiről azóta a felhasználók is megbizonyosodhattak. Ennek mozgóképes változata, az Imagen Video október elején mutatkozott be, amikor néhűnx nappal ezelőtt újabb cikk jelent meg a mesterséges intelligencia elképesztő szöveg-videó generálási képességeiről. Ennek alapján az algoritmus már 3D-s modelleket és rövid animációkat is képes alkotni, az anyagból azonban az is kideül, hogy a gyártó "számos fontos biztonsági és etikai kihívásra" hivatkozva egyelőre nem kívánja nyilvánossá tenni a megoldást.

Eszerint az Imagen Video rendszerét, illetve annak szöveges enkóderét a problémásnak nevezett adatokra is betanították, és bár a Google belső tesztjei szerint a nyílt és erőszakos tartalom nagy része azonosítható, továbbra is léteznek olyan "társadalmi elfogultságok és sztereotípiák", amelyeket nehéz felismerni és kiszűrni. Egyszerűbben fogalmazva, az MIsegítségével olyan videókat lehet generálni, amelyeknek szexuális, erőszakos vagy rasszista tartalma nem illik a techvállalat imázsához, így a modellt és annak forráskódját nem teszik közzé, ameddig ezen a területen nem sikerül megnyugtató megoldásokat találniuk.

A kockázatot ismerik, a megoldást még nem

A kommentárok szerint ez az újabb eset is rávilágít a gépi tanulás izgalmas valóságára, amennyiben a kutatók nem ritkán rendkívüli eredményeket produkáló modelleket fejlesztenek (az Imagen képei már a korábbi bemutatók alapján is lenyűgözőek), de nem igazán boldogulnak a lehetséges kimenetek ellenőrzésével. Ehhez hasonló problémákat más neurális hálózatokkal kapcsolatban is tapasztaltak, ahol pontosan azok a jelenségek jöttek elő, amelyekről a Google a mostani anyagában is ír, az Imagen pedig egy új elemmel gazdagítja a palettát, mivel a szövegből generált videók a közelmúltig nem voltak lehetségesek.

A Google cikének konklúziójában mindenesetre kiemelik, hogy a videós modellezés nagy számítási igényű dolog, amelyben értékes új technikát alkalmaznak a mintavételi folyamat felgyorsítására. Tekintettel a generatív modellezés terén a közelmúltban elért óriási előrehaladásra, a vállalat tudósai úgy láták, hogy a jövőben még bőven lesz lehetőségük a mesterséges intelligenciára épülő videógenerálás továbbfejlesztésére – bár úgy tűnik, hogy a fejlesztések közkinccsé tételéhez legalább ilyen fontos lesz a szóban forgó biztonsági és etikai kihívások leküzdése is. Ahogy írják, a generatív modellek alkalmasak a hamis, gyűlöletkeltő, explicit vagy káros tartalom generálására is, amit egyelőre a bemeneti szövegek és a kimeneti videótartalom szűrésével próbálnak korlátozni.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

A Bank of America is óriási zakóra figyelmezteti az MI-befektetőket

A mesterséges intelligenciával kapcsolatos várakozások a részvények példátlan túlértékeléséhez vezetnek, kérdés, hogy az egyensúly az MI ígéreteinek beváltásával vagy sokkal fájdalmasabb módon áll majd helyre.

A hónap témája

Túl a költségcsökkentésen - felnőtt a felhő

A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

A Bank of America is óriási zakóra figyelmezteti az MI-befektetőket

Túl a költségcsökkentésen - felnőtt a felhő

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!