A cég szerint semelyik másik hasonló alkalmazás nem képes szövegből ennyire élethű képeket, például egy hóban álló karateöves sárkánygyümölcsöt alkotni.
Hirdetés
 

Alig néhány héttel ezelőtt számoltunk be az OpenAI boszorkánykonyhájában kifőzött, szöveges bevitel alapján több stílusban is meggyőző képeket alkotó DALL-E új képességeiről. A Google-nél azonban nem lehettek elájulva a teljesítménytől, mivel saját megoldásuk sokkal előrébb tart a témában. Legalábbis ezt igyekeznek bizonygatni egy frissen publikált tanulmányukkal.

Betűkből alkotott látvány

Az Imagen elnevezésű projekt külön oldalt kapott, ahol némileg limitált formában, de a felhasználók is bebizonyosodhatnak arról, hogy egy másik algoritmus sem képes ennyire élethűen ábrázolni mondjuk azt, hogy "egy robotpár az Eiffel-torony előtt vacsorázik". A gondosan megválogatott példák alapján az Imagen valóban páratlan pontossággal és élethűséggel képes megragadni a témát pusztán abból a néhány szóból kiindulva, amit az adott feladat megvalósításához kap.

Ugyanakkor az több szempontból sem véletlen, hogy a projekt oldalán csak néhány variációban lehet próbára tenni a mesterséges intelligencia képességeit. Ezek a szövegből képet alkotó algoritmusok ugyanis nem feltétlenül képesek egyenletes jó teljesítményre, és bizonyos szavakkal, elemekkel rendszeresen meggyűlhet a bajuk, ami végső soron a végtermékként előállított fotók általános minőségét is rontja.

A Google-nél azonban ettől függetlenül úgy látják, az övék a legjobb "célszerszám" erre a feladatra. Ennek alátámasztására alkottak is egy értékelő rendszert. A DrawBench egy mintegy 200 előre rögzített kiinduló mondatból áll, melyekből a tesztbe bevont négy különböző algoritmus előállította a saját verzióját. Ezeket aztán önkéntesekkel értékeltették a kompozíció pontossága és élethűsége szerint. Nem meglepő módon a Google által lobogtatott teszt eredményei az Imagen elsöprő fölényét hozták.

Veszélyes játék

Azt viszont a Google is elismeri, hogy minden ilyen rendszer, beleértve a saját maguk által alkotottat is, súlyos problémák hordozója. A szövegből képet varázsoló mesterséges intelligenciának ugyanis hatalmas mennyiségű tanulási adatkészletre van szükség, amelyet egyszerűen képtelenség különböző paraméterek szerint előzetesen rostálni. A kutatók így kénytelenek óriási tömegben, gyakorlatilag válogatás nélkül "halászni" az alapanyagot az internetről, ami az ezekben megtalálható előítéletek újragenerálását eredményezi. Például ha az a feladat, hogy az algoritmus rajzoljon egy vezérigazgatót, az szinte biztos, hogy egy fehér férfi lesz.

Az algoritmusokkal elkövethető potenciális visszaélések lehetősége a másik komoly ok, amiért ezeket a rendszereket egyik fejlesztő sem nyitja meg a nyilvánosság előtt. A hírhamisítás és álhírek terjedése enélkül is hatalmas problémát jelent a világban, így tényleg nincs nagy szükség arra, hogy bárki képes legyen bármilyen légből kapott ötletét meggyőző képes formátummá varázsolni.

Cloud & big data

Kibervédelmi Waze-zel állnák el a hekker útját

Az ötlet Nadir Izraeltől, az Armis alapítójától ered, aki az Izraeli Védelmi Erők 8200-as elit egységénél kezdte karrierjét, később pedig a Google Maps felesztőcsapatát erősítette.
 
Hirdetés

A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető

Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.