Bármilyen lenyűgözőek az MI-alapú képszintetizáló programok, eddig a legfejlettebb technológia is következetesen elhasalt az emberi kezek ábrázolásával. Úgy tűnik azonban, hogy ezt a csorbát is gyorsan ki fogják köszörülni.

A Midjourney a múlt héten jelentette be kereskedelmi képszintetizáló szolgáltatásának legújabb, ötödik verzióját, amely már olyan szinten ontja magából a fotorealisztikus képeket, hogy azt egyes MI-rajongók is hátborzongatónak, sőt túl tökéletesnek értékelik – állapítja meg beszámolójában az Ars Technica. A Midjourney v5 alfa tesztelői, akik a Discordon keresztül előfizetnek a cég szolgáltatására, valósághű bőrtextúrákról és arcvonásokról, élet- vagy filmszerű megvilágításokról, jobb tükröződésekről és árnyékokról, kifejező beállításokról és valódinak tűnő szemekről beszélnek. Végül pedig ott vannak a kezek is, amelyek pontos ábrázolása eddig megoldhatatlan feladatnak tűnt a generatív mesterséges intelligencia számára.

Az utóbbi időben szinte közhelyessé vált, hogy az MI-rendszerek képtelenek megfelelően renderelni a kezeket az általuk létrehozott, szöveges utasítások alapján készített alkotásokon. Ez igaz volt a Midjourney képgenerátorának előző kiadására is: az év elején például felkapták azokat a virtuális házibulit bemutató, élethűnek tűnő fényképeket, amelyeken a kissé rémálomszerű figurák éppen azért voltak annyira nyomasztóak, mert az MI-nek nem igazán sikerült megfelelően ábrázolnia az emberi test bizonyos részeit. Az emberek kezére is hajlamos volt túl sok vagy túl kevés ujjat elhelyezni, és azzal sem volt teljesen tisztában, hogy a kezek vagy karok pontosan hogyan kapcsolódnak az emberi testhez.

Kezelgetik a problémát

A jelenség magyarázata általában az lehet, hogy a mesterséges intelligencia betanítására használt adatkészletekben a kezek nem olyan gyakran, és nem is annyira nyilvánvaló módon jelennek meg, mint mondjuk az arcok. Általában fognak is valamit, így az összes ujjuk sem mindig látható, a ruházat vagy a kitakarások miatt pedig az sem világos, hogy milyen módon lehetnek részei az emberi anatómiának. (Valószínűleg az MI által generált arcok is sokkal kevésbé lennének konzekvensek, ha a modelleket jórészt félig hátulról, orvosi maszkban készített fotókkal etetnék.) A Midjourney v5 viszont úgy tűnik, hogy már elég hatékonyan tud valósághű emberi kezeket generálni, még ha nem is mindig tökéletes eredménnyel.

A program időnként még mindig hat vagy több ujjal rendelkező kezeket produkál, nem beszélve az olyan feladatokról, mint mondjuk az egymásba kulcsolt kezek ábrázolása. Úgyhogy a teljesítménye még mindig jócskán elmarad a tökéletestől, de a javulás üteme már azt vetíti előre, hogy a képgenerátorok nemsokára ezeket az akadályokat is legyőzhetik. Egészen mostanáig népi bölcsességnek számított, hogy ilyen furcsaságok után kutatva a legegyszerűbb meggyőződni a képek mesterséges eredetéről – főleg, ha azok nyilvánvalóan valamilyen reakció kiváltását célozzák. Úgy tűnik azonban, hogy az MI által generált képek kiszúrása egyre nehezebb lesz, különösen, ha a kockázatok senkit sem hatnak meg igazán.

Közösség & HR

A testkamerák felvételei alapján készítene rendőrségi jelentéseket az MI

Pontosabban a Draft One nevű MI-alkalmazás fejlesztője, aki szerint jó ötlet rábízni az ilyesmit a totál megbízhatatlan mesterséges intelligenciára.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.