Egy új modell állítólag már a fejlesztés korai szakaszában jobban teljesít a hagyományos megoldásoknál, és az emberi arcokat is képes kezelni.

A fényképek mozgás miatti elmosódottságának (motion blur) korrigálására eddig is rendelkezésre álltak különféle eszközök, sőt a mesterséges intelligenciát sem most vetették be első alkalommal a rossz minőségű felvételek feljavítására. Az Nvidia, az MIT, és a finn Aalto University például már jó másfél éve közzétette egy közös kutatás eredményét, ami a képzajok csökkentéséről szól a kutatók által meghatározott gépi tanuló technikával. Legutóbb decemberben lehetett olvasni a Xiaomi új modelljéről, amely a rosszul exponált fotók részleteit és színeit segít helyreállítani, de ehhez hasonló megoldások az olyan nagy konzumer márkák eszköztárában is megjelentek már, mint amilyen az Apple vagy a Google.

Néhány nappal ezelőtt az Egyesült Arab Emírségekben működő Inception Institute of Artificial Intelligence, a pekingi Institute of Technology, illetve a New York-i Stony Brook University közös projektjéről jelentettek meg publikációt. Az ebben ismertetett eljárás már az utómunka fázisában képes élesíteni az elmosódott felvételeket, méghozzá úgy, hogy a képeken szereplő embereket és azok arcvonásait külön is értelmezi, vagyis egy általános szűrőhöz képest szemantikailag fontos részleteket tekintve is javítja a fotó minőségét. A kutatók ez utóbbit kiemelve állítják, hogy az új módszer már most is jobban teljesít a jelenleg használt legfejlettebb megoldásoknál.
 

forrás: github.com/ Ziyi Shen


A mozgás miatti elmosódottság a kép egyes elemeit tekintve a kamera és az objektumok egymáshoz viszonyított relatív elmozdulásaiból adódik, így az előtér és a háttér elemei is eltérő mértékben vagy módon degradálódhatnak – különösen, ha nem csak maga a kamera mozog, hanem a más-más távolságban lévő objektumok is. A kutatók által felvázolt modell ennek alapján maszkokkal határolja körül az előtérre és a háttérre jelemző változásokat: a rendszer tanításához használt, Human-aware Image Deblurring (HIDE) néven hivatkozott adatkészlet párokba rendezett felvételekből áll, amelyek egyike elmosódott, a másik viszont megfelelően éles.

Szép nem lesz, de felismerhető igen

A több mint 8 ezer párból álló HIDE sok ezer kültéri fényképet is tartalmaz, illetve nagy mennyiségben vonultatja fel a komplex háttereket vagy az előtérben tapasztalható sokféle bemozdulást. A képpárokat a leírás szerint előzőleg egy emberi formákat felismerő modellen is átfolyatják, ami lehetővé teszi, hogy nagyjából pontosan meghatározzák a képek szereplőinek befoglaló formáit. A fenti adatkészletben több mint 65 ezer ilyen objektum szerepel, ezeket külön-külön is megjelölik, mint embereket ábrázoló elemeket. A folyamat során (amelyhez mindössze egyetlen darab Nvidia Titan X grafikus kártyát használtak fel) mások mellett egy GoPro Hero sportkamerával készített felvételsorozatot is feldolgoztak, különbséget téve a praktikusan mozdulatlan és a mozgásban lévő alanyok között.

A kutatók szerint a rendszer már most is olyan eredményesen dolgozik, hogy a fényképek explicit struktúráját és a már említett szemantikai részleteket is figyelembe véve a leghatékonyabb eszköznek tekinthető a különböző forrásokból származó fotók rekonstrukciójához. A képek áltlános célú, az emberi szereplők azonosítására képes (human-aware) és részletes élesítése elsősorban a kézi eszközök, mobilok vagy fedélzeti kamerák felvételeivel lehet hasznos dolog az emberi szereplőkre koncentráló vizuális adattömeg feldolgozásában és szerkesztésében, mint amilyen mondjuk a járókelők azonosítása a kamerák felvételein. 

A dokumentumban számos illusztráció szemlélteti, hogy a kísérleti eredménynek milyen javulást ígérnek a pillanatnyilag elérhető hasonló eszközökkel szemben:
 

forrás: github.com/ Ziyi Shen

 

Konzumer tech

A Waymo robotaxik legyőzhetetlen ellenfele: az iskolabusz

Még egy texasi iskolakörzet is megpróbált segíteni, hogy a Waymo járművei végre megtanulják szabályosan kikerülni a gyerekeket fel- és leszállító iskolabuszokat, de megint kiderült, hogy mennyire ellentmondásos az önvezető technológia alkalmazkodóképessége.
 
Nincs egy új, "alapértelmezett" platform a VMware mellett, helyett; az informatikai vezetők egy, a korábbinál jelentősen összetettebb döntési helyzetben találják magukat 2026-ban. Cikkünk arra a kérdésre keresi a választ, hogy milyen lehetőségek közül választhatnak a CIO-k.

a melléklet támogatója az EURO ONE

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.