Ilyesmire eddig nem volt példa, a rendszer ráadásul a megfelelő betanítás után a másodperc töredéke alatt generálja a részletes háromdimenziós modelleket.

Az Nvidia vállalati blogján közzétett bejegyzés szerint a társaság olyan mesterséges intelligenciát fejleszt, amely egy kétdimenziós felvétel alapján képes megalkotni egy kiválasztott tárgy részletes, háromdimenziós modelljét. A DIB-R (differentiable interpolation-based renderer) nevű rendszer a bejelentés alapján a legelső olyan MI, amely sikeresen megoldotta ezt a feladatot. Ráadásul átlagosan kevesebb mint egy tizedmásodperc alatt elkészül a 3D-s modellekkel, ami az Nvidia szerint alkalmassá teszi az autonóm robotok területén való felhasználásra.

A tizedmásodperces teljesítményt természetesen minden esetben megelőzi a rendszer betanítása, ami nagyjából két napot vesz igénybe az objektumok egyes típusainak esetében. Ha például madarakat ábrázoló fotókat dolgoznak fel a rendszerben, akkor a későbbiekben a mesterséges intelligencia már villámgyorsan lemodellezi az olyan fajta madarakat is, amelyekkel korábban nem találkozott, jó közelítéssel megbecsülve azok alakját, színét vagy felületét.

Emberek megfigyelésére is kiválóan alkalmas

Ez a képesség mások mellett az önműködő robotok könnyebb tájékozódásában lehet hasznos a háromdimenziós közegben, de olyan alkalmazások előtt is megnyitja az utat, mint amilyen mondjuk a fényképek alapján rekonstruált virtuális környezetek felfedezése lenne az emberi felhasználók részéről, vagy akár egy régi fényképfelvétel 3D-s leképzése és megjelenítése. Ilyesmire persze már eddig is volt lehetőség, amennyiben rendelkezésre álltak a tárgyakról különböző nézetből készített képek, de érdemes újra kiemelni, hogy az Nvidia technológiája mindezt egyetlen kétdimenziós fotó alapján biztosítaná.
 

Az MI renderelt modellje egy madár fotója alapján (forrás: blogs.nvidia.com)

 

A modellt ezen a héten debütál a vancouveri NeurIPS konferencián, ahol részletesen bemutatják az új grafikai eszköz működését, illetve lehetséges alkalmazásait a robotikában, az önvezető járművek fejlesztésében vagy akár a biztonsági kamerarendszerek hatékonyságának javításában. Ez utóbbi a már megszokott módon rávilágít a friss technológia egy ijesztő vetületére is, hiszen így az arcfelismerő vagy más azonosító megoldások terjedésével elvileg még pontosabban lehet majd belőni, hogy ki sétált el a kamerák előtt.

A közleményben Jun Gao, az Nvidia egyik kutatója magyarázza el, hogy első ízben lesz lehetőségünk gyakorlatilag bármilyen 2D-s felvételből kinyerni a felvétel tárgyának releváns 3D-s tulajdonságait. A PyTorch gépi tanuló keretrendszerre épülő DIB-R egyébként a Kaolin, az Nvidia 3D-s mélytanuló PyTorch könyvtának része, amelynek célja, hogy felgyorsítsa a mélytanuló rendszerek kutatását. Az Nvidia kutatócsapata ma már több mint 200 szakemberből áll világszerte, és oylan területekre fókuszál, mint az MI, a gépi látás, az autonóm járművek, a robotika vagy a grafikus megjelenítés.

Cloud & big data

Biztonsági katasztrófával és kamu statisztikával érkezik a Trumpok okostelefonja

A kommentárok szerint a Trump Mobile T1-es okostelefonja már azzal felülmúlta az előzetes várakozásokat, hogy a jelek szerint tényleg létezik, de a szolgáltató tízszer több megrendelésről számolhatott be a valóságos számokhoz képest.
 
Hirdetés

Az adatkezelés újragondolása 2026-ban: hogyan oldja meg a Synology DS sorozat a valós üzleti kihívásokat

2026-ban a vállalkozások minden eddiginél több adatot generálnak és használnak. Az előrelátó vállalatok ezért újraértékelik a megközelítésüket: mi lenne, ha a tárolás, a biztonsági mentés és az együttműködés egyetlen rendszerben kezelhető lenne?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

a melléklet támogatója a ONE Solutions

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.