Egy új eljárás úgy javítja fel a kis felbontású, rossz minőségű arcképeket, ahogy eddig csak a tévében láthattuk. Az eredmény sosem teljesen pontos, de nem is nagyon lő mellé.

Az újkori filmek és sorozatok egyik legbénább technológiai vonatkozású ferdítése, amikor a hi-tech nyomozók kis méretű, alacsony felbontású felvételeket nagyítgatnak több száz- vagy ezerszeres méretre, és elolvassák az eredetileg ötször három képpontból álló figurák gallérján a mosoda pontos címét. Bár a valóságban nagy távolságból is megdöbbentően részletes fotókat lehet készíteni, és a tömörítés miatt lerontott videókat is meg lehet nézni eredeti felbontásban, egy eleve rossz minőségű képet nem lehet ilyen mértékben feljavítani. Legalábbis nem úgy, hogy releváns információt lehessen kinyerni belőle.

Az észak-karolinai Duke University kutatói nemrég egy olyan megoldással álltak elő, amely ha nem is produkálja a tévében látható trükköket, egy érdekes megközelítést alkalmaz a pixeles fotók, egész pontosan emberi arcok feldolgozására. A mintavételezési frekvenciájának utólagos megnövelését (upsampling) segítő MI-algoritmus, a PULSE (Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models) fotorealisztikus portrékat készít az eredeti mintákból, akár hatvannégyszeresére növelve azok felbontását. Ez azt jelenti, hogy egy 16×16 képpont méretű ikonból 1024×1024 pixeles, részletes arckép lesz.

Csak tippelget, de azt nagyon ügyesen teszi

A PULSE természetesen nem a lehetetlenre vállalkozik, vagyis nem olyan információt tesz láthatóvá, ami nincs is meg a forrásokban. Ehelyett megfordítja a dolog logikáját, és olyan képeket próbál generálni, amelyeket aztán az eredeti szintjére "visszarontva" a mintául szolgáló felvételeket minél jobban megközelítő eredményt kap. Ezáltal nem az eredeti arcokat varázsolja elő, hanem egy becslést ad, hogy azok nagy valószínűséggel milyenek lehettek – a becslései viszont elég pontosak ahhoz, hogy a technológia orvosi diagnosztikától a mikroszkópián át a műholdképekig egy nagy csomó képalkotó alkalmazásban felhasználható legyen.
 

forrás: Robin A. Smith, Duke University


A mesterséges intelligencia ebben az esetben is a GAN (generative adversarial networks) néven hivatkozott gépi tanuló technikát alkalmazza, amivel tulajdonképpen a két neurális hálózat közös működésére épülő rendszereket szokták jelölni. Ezek közül az egyik hálózat mindig a generátor (valamilyen információ létrehozója), a másik pedig a diszkriminátor (az információ értékelője). Utóbbi azt próbálja meghatározni, hogy a valódinak meghatározott minták hogyan viszonyulnak a másik hálózat által előállított mintákhoz, a visszacsatolás révén pedig az előbbi hálózat folyamatosan tanul, és egyre jobb eredményekre lesz képes.

Esetünkben az egyik hálózat elkezdi gyártani az eredeti minta alapján generált arcképeket, a másik pedig azt ellenőrzi, hogy az eredmények megfelelnek-e a szükséges paramétereknek. Ahogy az alábbi, a PULSE fejlesztőit ábrázoló demóból is jól látható, a rendszer nem képes (nem is lehet képes) visszaadni mindazt az információt, ami a képek minőségromlása során elveszett, ugyanakkor nagyon jól eltalálja, hogy eredetileg miről lehetett szó. A kutatók 40 emberi felhasználót is megszondáztak, hogy értékeljék a PULSE és öt másik scaling alkamazás által generált 1440 arcképet, és állításuk szerint a PULSE alkotásai majdnem olyan jól teljesítettek, mint az alanyokról készült eredeti, nagy felbontású fotók.

 

forrás: Robin A. Smith, Duke University

Cloud & big data

CIO Hungary Tavasz 2026: túléljük-e az adattá válásunkat?

Kétnapos tavaszi konferenciánk második napján bemutatkozott a Budapesti Corvinus Egyetem Adatelemzés és Informatika Intézetével közösen készített kutatásunk a hazai nagyvállalati informatikáról és informatikai vezetőkről, és az is kiderült, hogy melyek lehetnek az MI terjedésének társadalmi hatásai.
 
Hirdetés

Költségcsökkenésből finanszírozott modernizáció

A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.

A szolgáltatásként kínált mesterséges intelligencia és robotizált folyamatautomatizálási megoldások leegyszerűsítik a bevezetést, miközben új kockázatokat is hoznak.

a melléklet támogatója a ONE Solutions

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.