Mindenki számára elérhető képgenerátorral bővül a ChatGPT repertoárja – jelentette be az OpenAI. A fejlesztő saját megfogalmazása szerint a GPT-4o modellbe integrált funkcióval "nemcsak szép, hanem hasznos" képekhez jutnak a világ leghíresebb chatbotjának felhasználói.
A bejelentés szóhasználatát idézve a "mai generatív modellek képesek szürreális, lélegzetelállító jeleneteket varázsolni, de nehezen boldogulnak azokkal a képekkel, amelyeket az emberek információ megosztására és létrehozására használnak". Az ígéretek szerint ez utóbbiakkal is jól megbirkózik a cég fejlesztése, így többek között pontosan jelennek meg a képeken a szövegek, amivel valóban akadtak gondjaik az eddigi megoldásoknak.
További előnyként említik a következetességet és a különböző elemek, utasítások közötti kapcsolatok pontosabb megértését. És mivel immár a ChatGPT felületén zajlik a képgenerálás, az eredmény iterációkkal történő finomítása is gördülékenyebbé válik. A platform multimodális képességeinek bővítéséből adódóan a GPT-4o az inputként megadott képeket, illusztrációkat zökkenőmentesen tudja integrálni a feladat megoldásánál. Legalábbis ezt ígéri az OpenAI.
Képregényrajzolónak is elmegy az OpenAI új képgeneráló algoritmusa
A fejlett képességeket illusztrálására a cég mások mellett a fentebb látható példát hozta, ahol az algoritmus néhány sor szöveges utasítást követően teljesen vállalható mini képregényt rakott össze.
Hiszem, ha látom!
Persze a múltban már sokszor kiderült, hogy az, amit egy cég állít a termékéről, az nem feltétlenül fedi a teljes valóságot. Ez esetben jó hír viszont, hogy egyrészt az OpenAI azonnal elkezdi a funkció élesítését, másrészt ez a bevezetés kiterjed a ChatGPT erősen korlátos, ám ingyenesen használható verziójára is. (Mindez vélhetően leginkább annak köszönhető, hogy a vállalat riválisai sem fukarkodnak ezen a területen.) A funkció "hamarosan" API-n keresztül is elérhetővé válik a külső fejlesztők számára, illetve beépül a Sora videókészítő modellbe.
A jelek szerint egyébként ezzel vége a korábbi képkirály, a Dall-E karrierjének. Az ugyancsak az OpenAI műhelyében készült dedikált képgenerátor modellre a vállalati közlemény csak annyiban tér ki, hogy az önállóan továbbra is elérhető marad "azok számára, akiknek a DALL-E különleges helyet foglal el a szívében".
(Illusztráció: GPT-4o; OpenAI)
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak