Az OpenAI tavaly debütáló, szöveges utasításra eltérő stílusú képeket alkotó MI-algoritmusa máris magasabb osztályba lépett.
Hirdetés
 

Az OpenAI még 2021 elején mutatta be az a képgeneráló modelljét, amelyet a szürrealista Salvador Dalíról és a Pixar robotkarakteréről neveztek el. A kettő egyesítéséből született DALL-E mindkét névadóhoz hű, hiszen mesterséges intelligenciaként (MI) művészi alkotásokat állít elő. A kutatólaboratórium munkatársai alig egy évet követően most álltak elő a rendszer második generációjával, amely természetesen több szempontból is felülmúlja a korábbi modell képességeit.

DALL-E 2 elődjéhez hasonlóan szöveges beviteli adatok alapján próbál az utasításoknak megfelelő képet alkotni. Megadható, hogy kik, mik szerepeljenek a kreált jeleneten, illetve az is, hogy milyen stílusjegyeket hordozzon az alkotás. Az új változat sokoldalúbb és nagyobb felbontású képeket tud készíteni.

Az új verzióval lehetőség van arra is, hogy egy meglévő képen végeztessünk el kisebb, vagy éppen nagyobb változtatásokat a modellel. A program a meglévő keretek között, azaz a fényhatások, árnyékolás figyelembevételével igyekszik odavarázsolni a kért elemeket, természetesen stílusba illeszkedően.

Az algoritmust egy 3,5 milliárd paraméteres modell működteti, amelyet számtalan, az internetről származó képpáron és feliraton képeztek ki. A szoftver így megtanulja a kapcsolatot a vizuális fogalmak és a leíró szöveg között. A digitálisan létrehozott képek felbontásának növelésére egy külön 1,5 milliárd paraméteres modellt használ. A DALL-E 2 a diffúziónak nevezett folyamat segítségével generálja a képeket, ahol véletlenszerű pontokból álló mintázatokat adnak hozzá és változtatnak, miközben megpróbálják hozzáigazítani a képet egy adott stílushoz.

Bár az újabb modell sok szempontból meghaladja elődje kvalitásait, de a példák alapján még mindig küzd a bonyolultabb jelenetek finomabb részleteinek előállításával.

Kísérleti fázisban

A DALL-E 2 egyelőre kutatási fázisban van, ezért az OpenAI egyenlőre nem teszi elérhetővé API formájában. A vállalat ugyanakkor közölte, hogy "a mesterséges intelligencia felelősségteljes fejlesztésére és alkalmazására irányuló erőfeszítések részeként a felhasználók egy kiválasztott csoportjával" vizsgálja a DALL-E korlátait és képességeit.

A potenciális károk, például az előítéletesség megjelenésének minimalizálása érdekében a csapat igyekezett megtisztítani az adathalmazt: eltávolítva a valódi emberekről készült fotókat, fegyvereket, horogkereszteket és így tovább.

Cloud & big data

Új szupercéget legózna össze Elon Musk a SpaceX-ből, az xAI-ból és a Teslából

Lapértesülések szerint a tőzsdére készülő SpaceX-be olvadna egyik, másik, esetleg mindkét cég, összevonva a különböző projektek céljait és erőforrásait.
 
Hirdetés

Az ötlettől az értékteremtésig – az üzleti réteg szerepe az adattudományi működésben

Az adattudomány valódi értéke ott válik láthatóvá, ahol az előrejelzések döntésekké, a döntések pedig mérhető üzleti eredményekké alakulnak. Ehhez azonban tudatos üzleti beágyazásra, mérési keretrendszerekre és következetes visszacsatolásra is szükség van.

Vezetői példamutatás és megfelelő oktatás, vállalatikultúra-váltás nélkül gyakorlatilag lehetetlen adatvezérelt működést bevezetni. Cikkünk nemcsak a buktatókról, hanem azok elkerülésének módjairól is szól.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.