A ChatGPT prémium ügyfelei számára már elérhető az OpenAI képszintetizáló algoritmusának legújabb verziója. A DALL-E 3 a remények szerint egy sor olyan nehéz témát is képes kezelni, amelyek az előző generációkon és más hasonló fotógeneráló modelleken rendszerint kifogtak.
Kinőtte a gyermekbetegségeket
Ilyen feltűnően nehéz terepnek számított korábban a kezek, az arcok és a szövegek korrekt megjelenítése. Nem egyszer sikerült például sokkolóan sok ujjal, vagy éppen nem megfelelő helyen kapcsolódó végtagokkal megjeleníteni embereket a gép generálta képeken. A fejlődés azonban itt is tetten érhető, és a DALL-E mellett más modellek is képesek meghökkentően kreatív alkotásokra.
Visszatérve az OpenAI bejelentésére: a cég legújabb képgenerátora immár a ChatGPT rendszerébe intgrálva segíti a felhasználókat (amennyiben azok Plus- vagy Enterprise-előfizetők). A témáról szóló blogbejegyzés több példát is hoz arra, mennyire egyszerű szöveges utasításokkal munkára fogni DALL-E-t, "aki" az első tesztelők jelentése szerint tényleg egészen magas fokon űzi mesterségét.
DALL·E 3 is now available to all ChatGPT Plus & Enterprise users, letting you create unique images through conversation.
— OpenAI (@OpenAI) October 19, 2023
Describe your vision, let ChatGPT generate multiple variants, and then request edits — all in real-time. https://t.co/kV3O1VGFCq pic.twitter.com/egLHgnBFpV
Fékek és ellensúlyok
A képeket, szövegeket és egyéb alkotásokat szakmányban gyártó algoritmusok egyik problémája a szerzői jogok kérdése. Az OpenAI éppen ezért a DALL-E 3 esetében külön kiemeli, hogy a modell nem utasítható élő művészek stílusának utánzására. Ezen felül az alkotók azt is jelezhetik a cégnek, ha nem szeretnék, ha alkotásaikat arra használnák, hogy ezeket a modelleket betanítsák és továbbfejlesszék.
A biztonsági háló részét képezi az erőszakos, gyűlöletkeltő vagy szexuális tartalmú témák kiszűrése is azáltal, hogy ilyen feladatnak már neki sem áll az algoritmus, mert már a generálás előtt leállítódik a munkafolyamat. Végezetül a cég azt is közölte, hogy rendelkezésre bocsát egy olyan eszközt, amellyel felismerhetők lesznek a DALL-E 3 által generált alkotások.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak