A gyártó pontos és realisztikus képeket ígér a szöveges parancsok alapján, emellett megszabadítaná a felhasználókat az ilyen típusú modellek néhány makacs problémájától is.

A Google bemutatta legújabb szöveg-kép generáló rendszerét, az Imagen 2-t, amit első körben a Vertex AI platform ügyfeleinek tett elérhetővé. A Google Cloud blogjának bejegyzése a technológia hat kulcsfontosságú jellemzőjét emeli ki. Az Imagen 2 az intuitív eszközök, a teljes körűen felügyelt infrastruktúra és a beépített biztonsági funkciók mellett jelentősen jobb képminőséggel kecsegteti a fejlesztőket, természetes nyelvi utasítások alapján nagy felbontású képeket hozva létre akár a speciális felhasználási esetekben is.

Ezzel kapcsolatban a bejelentésben külön is kitérnek rá, hogy előnézetben az angol mellett már hindi, japán, kínai, koreai, portugál és spanyol nyelven is támogatják a pontos szövegmegjelenítést. Amikor a felhasználók egy adott nyelven írják a promptot, utasíthatják a robotot, hogy a választ egy másik nyelven adja ki, 2024 elejére pedig a repertoár további bővítését tervezik. Ahogy nemrég kiderült, ugyanekkor érkezhet majd a Gemini nagy nyelvi modell Ultra kiadása is, amit "rendkívül összetett feladatok kezelésére", adatközponti és nagyvállalati alkalmazásokhoz terveztek.

Könnyebb lesz együtt dolgozni vele

A pontos szövegmegjelenítés a Google szerint nagyobb kontrollt biztosít a szöveg-kép promptok felett: lényegében azt jelenti, hogy a felhasználók kérésének alapvető értelme konzisztens marad a szoftveres képalkotás során, amit a vállalat a teljes iparágat tekintve megoldandó problémának nevez. Az Imagen 2 egyébként a Vertex AI alatt a Gemini Pro modellhez csatlakozik, és a Google adatközpontjairól futtatva integrálható az androidos alkalmazásokba. Ezzel lehetővé válik, hogy alkalmazásuk újabb back-end struktúra nélkül futhasson a Google adatközpontjairól.

A funkciók felsorolásában ott van a kreatív logók tervezése és termékekre, ruhákra, névjegykártyákra való elhelyezése, a leíró jellegű, terjedelmes feliratozás, illetve a részletes válaszok kiadása a képek elemeire vonatkozó kérdésekre. Ennél is fontosabb, hogy az Imagen 2 beépített biztonsági készségeket tartalmaz: integrálták például a Google kísérleti digitális vízjelezését az Imagen által generált képek ellenőrzésére, és olyan átfogó biztonsági szűrőket is alkalmaznak, amelyek célja, hogy segítsenek időben elejét venni a potenciálisan káros tartalom létrehozásának.

Részletek a Google Cloud blog bejegyzésében »

(Kép forrása: Google)

Cloud & big data

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Egy 2018 óta húzódó ügy végére került pont tegnap azzal, hogy az Európai Unió Bírósága tegnap helyben hagyta a versenykorlátozó intézkedések miatt a Google-re kiszabott 4,1 milliárd eurós EU-s bírságot.
 
A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.