Segíthet megérteni azt az eddig kevéssé kutatott jelenséget, ahogy az emberek egyszerre több érzékszervükön keresztül szereznek benyomásokat a környezetükről, például hangok alapján is élesen maguk elé tudnak képzelni konkrét helyeket.
Hirdetés
 

Az austini Texasi Egyetem kutatói a generatív mesterséges intelligencia segítségével alakítottak át hangfelvételeket utcaképekké: az erről közzétett tanulmányuk szerint sikerült igazolniuk, hogy az akusztikus környezet is elegendő utalást tartalmaz olyan vizuális elemekre, amelyekből jól felismerhető képeken ábrázolhatják a különböző helyeket. Az előállított képek pontossága pedig azt mutatja, hogy a gépek is képesek lehetnek reprodukálni azt a jelenséget, amikor az emberek összekapcsolják a környezet látással és hallással való észlelését.

A cikkben leírják az általuk fejlesztett MI-modell betanítását különféle városi és vidéki utcák hang- és képi adatainak felhasználásával, ami aztán "élénk vizuális megjelenítésekké" alakítja a hangfelvételeket. Az észak-amerikai, ázsiai és európai városokból származó YouTube-anyagokból 10 másodperces hangfelvétel- és állókép-párokat állítottak össze, majd emberi és gépi értékelésekkel hasonlították össze az MI-vel létrehozott képeket a valós fotókkal. Az eddigi eredmények a legerősebb korrelációt az égbolt és a zöldfelület arányában mutatták, de az emberi résztvevők így is átlagosan 80 százalékos pontossággal ismerték fel azokat a képeket, amelyek megfeleltek a források hangmintáinak.

Géppel fejtenék meg az egyedi hangulatot

A kutatás vezetője szerint hagyományosan emberi képesség, ha egy komplett jelenetet el tudunk képzelni kizárólag hangok alapján, de ezt a "környezetünkkel való mély érzékszervi kapcsolatot" a jelek szerint a nagy nyelvi modellekre épülő technikákkal is meg lehet közelíteni. Szerinte ez arra utal, hogy a mesterséges intelligencia többre képes a fizikai környezet puszta felismerésénél, és azt is segíthet megérteni, hogy a multiszenzoros tényezők hogyan járulnak hozzá a különböző helyekhez kapcsolódó szubjektív emberi tapasztalatokhoz.

Mint kiderült, az MI gyakran az épített objektumok távolságát vagy akár építészeti jegyeit is eltalálta, sőt pontosan visszaadta, hogy napsütéses, felhős vagy esetleg éjszakai fényviszonyok között rögzítették-e az anyagokat, például a közlekedési hangok vagy az éjszakai rovarok ciripelése alapján. A tudósok ezeken keresztül a mesterséges intelligencia térinformatikai használatát kutatják az emberek és a környezetük kölcsönhatásának tanulmányozásával: az egyetem közleményében felidéznek egy másik, a Nature-ben megjelent cikket is, amelyben a szerzők azt vizsgálták, hogy az MI milyen módon lehet képes a városi környezetek egyedi identitását adó jellemzők azonosítására.

a kép forrása: news.utexas.edu

Cloud & big data

Szimulált elefántok leplezik le az önvezető rendszerek ügyetlenségét

Egy új benchmark azokat a megbízhatósági értékeléseket feszegeti, amelyekből nem igazán derül ki, hogy az önvezető modellek hogyan és milyen gyakran mondanak csődöt a váratlan helyzetekben.
 
Hirdetés

A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető

Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.