Segíthet megérteni azt az eddig kevéssé kutatott jelenséget, ahogy az emberek egyszerre több érzékszervükön keresztül szereznek benyomásokat a környezetükről, például hangok alapján is élesen maguk elé tudnak képzelni konkrét helyeket.

Az austini Texasi Egyetem kutatói a generatív mesterséges intelligencia segítségével alakítottak át hangfelvételeket utcaképekké: az erről közzétett tanulmányuk szerint sikerült igazolniuk, hogy az akusztikus környezet is elegendő utalást tartalmaz olyan vizuális elemekre, amelyekből jól felismerhető képeken ábrázolhatják a különböző helyeket. Az előállított képek pontossága pedig azt mutatja, hogy a gépek is képesek lehetnek reprodukálni azt a jelenséget, amikor az emberek összekapcsolják a környezet látással és hallással való észlelését.

A cikkben leírják az általuk fejlesztett MI-modell betanítását különféle városi és vidéki utcák hang- és képi adatainak felhasználásával, ami aztán "élénk vizuális megjelenítésekké" alakítja a hangfelvételeket. Az észak-amerikai, ázsiai és európai városokból származó YouTube-anyagokból 10 másodperces hangfelvétel- és állókép-párokat állítottak össze, majd emberi és gépi értékelésekkel hasonlították össze az MI-vel létrehozott képeket a valós fotókkal. Az eddigi eredmények a legerősebb korrelációt az égbolt és a zöldfelület arányában mutatták, de az emberi résztvevők így is átlagosan 80 százalékos pontossággal ismerték fel azokat a képeket, amelyek megfeleltek a források hangmintáinak.

Géppel fejtenék meg az egyedi hangulatot

A kutatás vezetője szerint hagyományosan emberi képesség, ha egy komplett jelenetet el tudunk képzelni kizárólag hangok alapján, de ezt a "környezetünkkel való mély érzékszervi kapcsolatot" a jelek szerint a nagy nyelvi modellekre épülő technikákkal is meg lehet közelíteni. Szerinte ez arra utal, hogy a mesterséges intelligencia többre képes a fizikai környezet puszta felismerésénél, és azt is segíthet megérteni, hogy a multiszenzoros tényezők hogyan járulnak hozzá a különböző helyekhez kapcsolódó szubjektív emberi tapasztalatokhoz.

Mint kiderült, az MI gyakran az épített objektumok távolságát vagy akár építészeti jegyeit is eltalálta, sőt pontosan visszaadta, hogy napsütéses, felhős vagy esetleg éjszakai fényviszonyok között rögzítették-e az anyagokat, például a közlekedési hangok vagy az éjszakai rovarok ciripelése alapján. A tudósok ezeken keresztül a mesterséges intelligencia térinformatikai használatát kutatják az emberek és a környezetük kölcsönhatásának tanulmányozásával: az egyetem közleményében felidéznek egy másik, a Nature-ben megjelent cikket is, amelyben a szerzők azt vizsgálták, hogy az MI milyen módon lehet képes a városi környezetek egyedi identitását adó jellemzők azonosítására.

a kép forrása: news.utexas.edu

Cloud & big data

Tajvan szankciós listára tett két jelentős kínai techcéget

A Huawei és a SMIC ellen hozott, csipexportot szigorító rendelkezés inkább politikai, mint gyakorlati jelentőségű.
 
Hirdetés

Miért kell az üzleti intelligenciának megelőznie az MI bevezetését?

A felfokozott várakozásokhoz képest kiábrándító az MI-bevezetések valósága, ebben pedig a fő bűnös a rossz adatminőség és nem megfelelő adatinfrastruktúra.

A digitális támadások célpontjai ma már nem feltétlenül azok a vállalatok, amelyektől a támadók adatokat vagy pénzt akarnak szerezni. Elég, ha a támadás egyik láncszeme nem védett – az elkövetők ezen keresztül lépnek be a rendszerbe. És ez a láncszem gyakran nem is belül van.

a melléklet támogatója a One Solutions

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.