A Google bejelentette az Imagen 2 szöveg-kép generátort

Bitport2023.12.15.Cloud & big data

A gyártó pontos és realisztikus képeket ígér a szöveges parancsok alapján, emellett megszabadítaná a felhasználókat az ilyen típusú modellek néhány makacs problémájától is.

A Google bemutatta legújabb szöveg-kép generáló rendszerét, az Imagen 2-t, amit első körben a Vertex AI platform ügyfeleinek tett elérhetővé. A Google Cloud blogjának bejegyzése a technológia hat kulcsfontosságú jellemzőjét emeli ki. Az Imagen 2 az intuitív eszközök, a teljes körűen felügyelt infrastruktúra és a beépített biztonsági funkciók mellett jelentősen jobb képminőséggel kecsegteti a fejlesztőket, természetes nyelvi utasítások alapján nagy felbontású képeket hozva létre akár a speciális felhasználási esetekben is.

Ezzel kapcsolatban a bejelentésben külön is kitérnek rá, hogy előnézetben az angol mellett már hindi, japán, kínai, koreai, portugál és spanyol nyelven is támogatják a pontos szövegmegjelenítést. Amikor a felhasználók egy adott nyelven írják a promptot, utasíthatják a robotot, hogy a választ egy másik nyelven adja ki, 2024 elejére pedig a repertoár további bővítését tervezik. Ahogy nemrég kiderült, ugyanekkor érkezhet majd a Gemini nagy nyelvi modell Ultra kiadása is, amit "rendkívül összetett feladatok kezelésére", adatközponti és nagyvállalati alkalmazásokhoz terveztek.

Könnyebb lesz együtt dolgozni vele

A pontos szövegmegjelenítés a Google szerint nagyobb kontrollt biztosít a szöveg-kép promptok felett: lényegében azt jelenti, hogy a felhasználók kérésének alapvető értelme konzisztens marad a szoftveres képalkotás során, amit a vállalat a teljes iparágat tekintve megoldandó problémának nevez. Az Imagen 2 egyébként a Vertex AI alatt a Gemini Pro modellhez csatlakozik, és a Google adatközpontjairól futtatva integrálható az androidos alkalmazásokba. Ezzel lehetővé válik, hogy alkalmazásuk újabb back-end struktúra nélkül futhasson a Google adatközpontjairól.

A funkciók felsorolásában ott van a kreatív logók tervezése és termékekre, ruhákra, névjegykártyákra való elhelyezése, a leíró jellegű, terjedelmes feliratozás, illetve a részletes válaszok kiadása a képek elemeire vonatkozó kérdésekre. Ennél is fontosabb, hogy az Imagen 2 beépített biztonsági készségeket tartalmaz: integrálták például a Google kísérleti digitális vízjelezését az Imagen által generált képek ellenőrzésére, és olyan átfogó biztonsági szűrőket is alkalmaznak, amelyek célja, hogy segítsenek időben elejét venni a potenciálisan káros tartalom létrehozásának.

Részletek a Google Cloud blog bejegyzésében »

(Kép forrása: Google)

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Egy 2018 óta húzódó ügy végére került pont tegnap azzal, hogy az Európai Unió Bírósága tegnap helyben hagyta a versenykorlátozó intézkedések miatt a Google-re kiszabott 4,1 milliárd eurós EU-s bírságot.

A hónap témája

Túl a költségcsökkentésen - felnőtt a felhő

A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Túl a költségcsökkentésen - felnőtt a felhő

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!