A Magánbeszélgetések Harry Caulja valószínűleg megnyalja tíz ujját, ha ilyen cuccal dolgozhatott volna.

Kereken ötven éve mutatták be Francis Ford Coppola remek thrillerét, a Magánbeszélgetéseket. A film főhőse egy profi "hallgatózó", Harry Caul (Gene Hackman egyik legnagyobb alakítása), aki akár egy zajos téren sétálgató pár beszélgetését is képes rögzíteni saját fejlesztésű különleges eszközeivel. Ha ma szeretne valaki Harry Caul bőrébe bújni, sokkal egyszerűbb dolga lenne.

Januárban a CES-en már bemutattak olyan fülhallgatókat, melyek a Bluetooth Auracast nevű funkciója segítségével lokális műsorszóróvá varázsolnak közösségi terekben elhelyezett tévéket és más taralomközvetítő eszközöket. A Washingtoni Egyetem kutatói azonban ennél sokkal izgalmasabbat raktak össze: olyan headsetet, amivel bármilyen zajos környezetben képesek leszünk csak egy valakit hallgatni (vagy kihallgatni?).

A zajszűrő fejhallgató nem újdonság. Van azonban a zajszűrésnek egy speciális esete, amire mindezidáig nem született igazán jó megoldás: hogyan oldjuk meg zajos tömegben, hogy csak egy valaki hangját halljuk? Az Apple AirPods Pro legújabb kiadásában van hasonló funkció, de annál sem lehet befolyásolni, hogy fókuszáltan csak egy valaki hangját engedje át a szűrője.

Segít a mesterséges intelligencia

Az egyetem kutatócsapata erre a speciális helyzetre talált megoldást. Kifejlesztettek egy MI-rendszert, amivel csak pár másodpercig kell "figyelni" a kiszemelt ember hangját, és utána a füles már csak az ő megszólalásait közvetíti, pontosabban kiemeli a környezet zajából. A Target Speech Hearing nevű rendszer ugyanis jó hatásfokkal halkítja el az egyéb zavaró hangot a környezet zajszintjétől függetlenül. Ráadásul az azonosítási procedúra után már arra sincs szükség, hogy a hallgatózónak közvetlen "rálátása" legyen a beszélőre.

A kutatók nem akarnak kereskedelmi terméket a találmányukból (egyelőre), sőt a proof of concept kódját közzé is tették a GitHubon, hogy mások továbbgondolhassák.

A rendszer egyik fontos eleme egy olyan headset, aminek mindkét oldalán van mikrofon. Viselője kiválasztja a hangforrást, majd megérint egy gombot, és 3-5 másodpercig a hangforrás irányába néz. Fontos, hogy a hangforrásból érkező hullámok közel egyszerre érkezzenek a két mikrofonhoz. A fejhallgató továbbítja a jelet egy beágyazott számítógépre, amelyen egy gépi tanulási szoftver megtanulja a hangmintát. Onnantól kezdve a hallgatózó a kiválasztott hangforrást hallja még akkor is, ha ő és a beszélő is folyamatosan mozog. Minél több mintát dolgoz fel a szoftver, annál tisztább lesz a hangkép.

A rendszert tesztelők átlagosan mintegy kétszer tisztábbnak, érhetőbbnek ítélték a rendszer továbbította hangokat, mint a szűrés nélkülieket.

Egyelőre szükség van Harry Caul trükkjeire

A rendszer persze közel sem tökéletes. Legnagyobb korlátja, hogy egyszerre csak egy hangforrást tud tisztítani – azaz már egy párbeszédet sem lehet vele kihallgatni. Szintén jelentős limitáció, hogy csak akkor lehet azonosítani egyértelműen a forrást, ha ugyanabból az irányból nem érkezik más hanghullám. Persze többszöri próbálkozással lehet javítani a hangminőségen.

És még egy: a kutatók nem kifejezetten másokat titokban kihallgatni vágyókra gondoltak, hanem például hallássérültek támogatására. Számukra egy ilyen funkcióval ellátott hallókészülék óriási segítséget jelentene például egy zsúfoltabb térben, ahol sokan beszélnek egyszerre viszonylag azonos hangerővel.

(Illusztráció: részlet Coppola filmjéből. Forrás: YouTube)

Piaci hírek

A vámtárgyalások miatt csúszhat az amerikai cégek EU-s büntetése

Az Európai Bizottságnak elvileg a héten kellett volna bejelentenie a Meta és az Apple ellen tavaly indított vizsgálatok eredményét, ám sajtóértesülések szerint Brüsszel az USA-val folytatott kereskedelmi tárgyalások miatt jegeli az ügyeket.
 
Hirdetés

Exkluzív szakmai nap a felhők fölött: KYOCERA Roadshow a MOL Toronyban

A jövő irodája már nem a jövő – hanem a jelen. A digitális transzformáció új korszakába lépünk, és ebben a KYOCERA nemcsak követi, hanem formálja is az irányt. Most itt a lehetőség, hogy első kézből ismerje meg a legújabb hardveres és szoftveres fejlesztéseket, amelyekkel a KYOCERA új szintre emeli a dokumentumkezelést és az üzleti hatékonyságot.

A mesterséges intelligencia új korszakába léptünk. A generatív MI nem csupán kísérleti technológia. Sok cég stratégiai eszköznek tekinti, amely segít a versenyképesség megőrzésében, javításában.

a melléklet támogatója a One Solutions

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.