A Google bemutatta legújabb szöveg-kép generáló rendszerét, az Imagen 2-t, amit első körben a Vertex AI platform ügyfeleinek tett elérhetővé. A Google Cloud blogjának bejegyzése a technológia hat kulcsfontosságú jellemzőjét emeli ki. Az Imagen 2 az intuitív eszközök, a teljes körűen felügyelt infrastruktúra és a beépített biztonsági funkciók mellett jelentősen jobb képminőséggel kecsegteti a fejlesztőket, természetes nyelvi utasítások alapján nagy felbontású képeket hozva létre akár a speciális felhasználási esetekben is.
Ezzel kapcsolatban a bejelentésben külön is kitérnek rá, hogy előnézetben az angol mellett már hindi, japán, kínai, koreai, portugál és spanyol nyelven is támogatják a pontos szövegmegjelenítést. Amikor a felhasználók egy adott nyelven írják a promptot, utasíthatják a robotot, hogy a választ egy másik nyelven adja ki, 2024 elejére pedig a repertoár további bővítését tervezik. Ahogy nemrég kiderült, ugyanekkor érkezhet majd a Gemini nagy nyelvi modell Ultra kiadása is, amit "rendkívül összetett feladatok kezelésére", adatközponti és nagyvállalati alkalmazásokhoz terveztek.
Könnyebb lesz együtt dolgozni vele
A pontos szövegmegjelenítés a Google szerint nagyobb kontrollt biztosít a szöveg-kép promptok felett: lényegében azt jelenti, hogy a felhasználók kérésének alapvető értelme konzisztens marad a szoftveres képalkotás során, amit a vállalat a teljes iparágat tekintve megoldandó problémának nevez. Az Imagen 2 egyébként a Vertex AI alatt a Gemini Pro modellhez csatlakozik, és a Google adatközpontjairól futtatva integrálható az androidos alkalmazásokba. Ezzel lehetővé válik, hogy alkalmazásuk újabb back-end struktúra nélkül futhasson a Google adatközpontjairól.
A funkciók felsorolásában ott van a kreatív logók tervezése és termékekre, ruhákra, névjegykártyákra való elhelyezése, a leíró jellegű, terjedelmes feliratozás, illetve a részletes válaszok kiadása a képek elemeire vonatkozó kérdésekre. Ennél is fontosabb, hogy az Imagen 2 beépített biztonsági készségeket tartalmaz: integrálták például a Google kísérleti digitális vízjelezését az Imagen által generált képek ellenőrzésére, és olyan átfogó biztonsági szűrőket is alkalmaznak, amelyek célja, hogy segítsenek időben elejét venni a potenciálisan káros tartalom létrehozásának.
Részletek a Google Cloud blog bejegyzésében »
(Kép forrása: Google)
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak