A cég szerint semelyik másik hasonló alkalmazás nem képes szövegből ennyire élethű képeket, például egy hóban álló karateöves sárkánygyümölcsöt alkotni.

Alig néhány héttel ezelőtt számoltunk be az OpenAI boszorkánykonyhájában kifőzött, szöveges bevitel alapján több stílusban is meggyőző képeket alkotó DALL-E új képességeiről. A Google-nél azonban nem lehettek elájulva a teljesítménytől, mivel saját megoldásuk sokkal előrébb tart a témában. Legalábbis ezt igyekeznek bizonygatni egy frissen publikált tanulmányukkal.

Betűkből alkotott látvány

Az Imagen elnevezésű projekt külön oldalt kapott, ahol némileg limitált formában, de a felhasználók is bebizonyosodhatnak arról, hogy egy másik algoritmus sem képes ennyire élethűen ábrázolni mondjuk azt, hogy "egy robotpár az Eiffel-torony előtt vacsorázik". A gondosan megválogatott példák alapján az Imagen valóban páratlan pontossággal és élethűséggel képes megragadni a témát pusztán abból a néhány szóból kiindulva, amit az adott feladat megvalósításához kap.

Ugyanakkor az több szempontból sem véletlen, hogy a projekt oldalán csak néhány variációban lehet próbára tenni a mesterséges intelligencia képességeit. Ezek a szövegből képet alkotó algoritmusok ugyanis nem feltétlenül képesek egyenletes jó teljesítményre, és bizonyos szavakkal, elemekkel rendszeresen meggyűlhet a bajuk, ami végső soron a végtermékként előállított fotók általános minőségét is rontja.

A Google-nél azonban ettől függetlenül úgy látják, az övék a legjobb "célszerszám" erre a feladatra. Ennek alátámasztására alkottak is egy értékelő rendszert. A DrawBench egy mintegy 200 előre rögzített kiinduló mondatból áll, melyekből a tesztbe bevont négy különböző algoritmus előállította a saját verzióját. Ezeket aztán önkéntesekkel értékeltették a kompozíció pontossága és élethűsége szerint. Nem meglepő módon a Google által lobogtatott teszt eredményei az Imagen elsöprő fölényét hozták.

Veszélyes játék

Azt viszont a Google is elismeri, hogy minden ilyen rendszer, beleértve a saját maguk által alkotottat is, súlyos problémák hordozója. A szövegből képet varázsoló mesterséges intelligenciának ugyanis hatalmas mennyiségű tanulási adatkészletre van szükség, amelyet egyszerűen képtelenség különböző paraméterek szerint előzetesen rostálni. A kutatók így kénytelenek óriási tömegben, gyakorlatilag válogatás nélkül "halászni" az alapanyagot az internetről, ami az ezekben megtalálható előítéletek újragenerálását eredményezi. Például ha az a feladat, hogy az algoritmus rajzoljon egy vezérigazgatót, az szinte biztos, hogy egy fehér férfi lesz.

Az algoritmusokkal elkövethető potenciális visszaélések lehetősége a másik komoly ok, amiért ezeket a rendszereket egyik fejlesztő sem nyitja meg a nyilvánosság előtt. A hírhamisítás és álhírek terjedése enélkül is hatalmas problémát jelent a világban, így tényleg nincs nagy szükség arra, hogy bárki képes legyen bármilyen légből kapott ötletét meggyőző képes formátummá varázsolni.

Cloud & big data

Vajon milyen céget gründol a Theranos-csalásról elhíresült Elisabeth Holmes párja?

Természetesen olyat, amelyik radikálisan új vérvizsgálattal kívánja forradalmasítani az egészségügyet. Legutóbb ezért 11 év letöltendő járt a családban.
 
Hirdetés

Digitalizáció a mindennapokban: hogyan lesz a stratégiai célból napi működés?

A digitális transzformáció sok vállalatnál már nem cél, hanem elvárás – mégis gyakran megreked a tervezőasztalon. A vezetői szinten megfogalmazott ambiciózus tervek nehezen fordulnak át napi működéssé, ha hiányzik a technológiai rugalmasság vagy a belső kohézió.

Azok a vállalatok, amelyek gyorsabban, intelligensebben és empatikusabban tudnak reagálni ügyfeleik kérdéseire, összességében értékesebb, hosszabb távú kapcsolatokat építhetnek ki.

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.