A Magánbeszélgetések Harry Caulja valószínűleg megnyalja tíz ujját, ha ilyen cuccal dolgozhatott volna.

Kereken ötven éve mutatták be Francis Ford Coppola remek thrillerét, a Magánbeszélgetéseket. A film főhőse egy profi "hallgatózó", Harry Caul (Gene Hackman egyik legnagyobb alakítása), aki akár egy zajos téren sétálgató pár beszélgetését is képes rögzíteni saját fejlesztésű különleges eszközeivel. Ha ma szeretne valaki Harry Caul bőrébe bújni, sokkal egyszerűbb dolga lenne.

Januárban a CES-en már bemutattak olyan fülhallgatókat, melyek a Bluetooth Auracast nevű funkciója segítségével lokális műsorszóróvá varázsolnak közösségi terekben elhelyezett tévéket és más taralomközvetítő eszközöket. A Washingtoni Egyetem kutatói azonban ennél sokkal izgalmasabbat raktak össze: olyan headsetet, amivel bármilyen zajos környezetben képesek leszünk csak egy valakit hallgatni (vagy kihallgatni?).

A zajszűrő fejhallgató nem újdonság. Van azonban a zajszűrésnek egy speciális esete, amire mindezidáig nem született igazán jó megoldás: hogyan oldjuk meg zajos tömegben, hogy csak egy valaki hangját halljuk? Az Apple AirPods Pro legújabb kiadásában van hasonló funkció, de annál sem lehet befolyásolni, hogy fókuszáltan csak egy valaki hangját engedje át a szűrője.

Segít a mesterséges intelligencia

Az egyetem kutatócsapata erre a speciális helyzetre talált megoldást. Kifejlesztettek egy MI-rendszert, amivel csak pár másodpercig kell "figyelni" a kiszemelt ember hangját, és utána a füles már csak az ő megszólalásait közvetíti, pontosabban kiemeli a környezet zajából. A Target Speech Hearing nevű rendszer ugyanis jó hatásfokkal halkítja el az egyéb zavaró hangot a környezet zajszintjétől függetlenül. Ráadásul az azonosítási procedúra után már arra sincs szükség, hogy a hallgatózónak közvetlen "rálátása" legyen a beszélőre.

A kutatók nem akarnak kereskedelmi terméket a találmányukból (egyelőre), sőt a proof of concept kódját közzé is tették a GitHubon, hogy mások továbbgondolhassák.

A rendszer egyik fontos eleme egy olyan headset, aminek mindkét oldalán van mikrofon. Viselője kiválasztja a hangforrást, majd megérint egy gombot, és 3-5 másodpercig a hangforrás irányába néz. Fontos, hogy a hangforrásból érkező hullámok közel egyszerre érkezzenek a két mikrofonhoz. A fejhallgató továbbítja a jelet egy beágyazott számítógépre, amelyen egy gépi tanulási szoftver megtanulja a hangmintát. Onnantól kezdve a hallgatózó a kiválasztott hangforrást hallja még akkor is, ha ő és a beszélő is folyamatosan mozog. Minél több mintát dolgoz fel a szoftver, annál tisztább lesz a hangkép.

A rendszert tesztelők átlagosan mintegy kétszer tisztábbnak, érhetőbbnek ítélték a rendszer továbbította hangokat, mint a szűrés nélkülieket.

Egyelőre szükség van Harry Caul trükkjeire

A rendszer persze közel sem tökéletes. Legnagyobb korlátja, hogy egyszerre csak egy hangforrást tud tisztítani – azaz már egy párbeszédet sem lehet vele kihallgatni. Szintén jelentős limitáció, hogy csak akkor lehet azonosítani egyértelműen a forrást, ha ugyanabból az irányból nem érkezik más hanghullám. Persze többszöri próbálkozással lehet javítani a hangminőségen.

És még egy: a kutatók nem kifejezetten másokat titokban kihallgatni vágyókra gondoltak, hanem például hallássérültek támogatására. Számukra egy ilyen funkcióval ellátott hallókészülék óriási segítséget jelentene például egy zsúfoltabb térben, ahol sokan beszélnek egyszerre viszonylag azonos hangerővel.

(Illusztráció: részlet Coppola filmjéből. Forrás: YouTube)

Piaci hírek

Mikrovállalkozót csinált chatbotjából az Anthropic

A házon belül lefolytatott kísérleti projekt során az algoritmus stabilan szállította a furcsábbnál furcsább megoldásokat. A cég igyekszik az itt leszűrt tapasztalatokat a modellek fejlesztésénél kamatoztatni.
 
Hirdetés

Így újult meg Magyarország leggyorsabb mobilhálózata

Közel 100 milliárd forintos beruházással, a rádiós és maghálózat teljes modernizációjával zárult le a Yettel történetének egyik legnagyobb műszaki fejlesztése.

A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.