A Magánbeszélgetések Harry Caulja valószínűleg megnyalja tíz ujját, ha ilyen cuccal dolgozhatott volna.
Hirdetés
 

Kereken ötven éve mutatták be Francis Ford Coppola remek thrillerét, a Magánbeszélgetéseket. A film főhőse egy profi "hallgatózó", Harry Caul (Gene Hackman egyik legnagyobb alakítása), aki akár egy zajos téren sétálgató pár beszélgetését is képes rögzíteni saját fejlesztésű különleges eszközeivel. Ha ma szeretne valaki Harry Caul bőrébe bújni, sokkal egyszerűbb dolga lenne.

Januárban a CES-en már bemutattak olyan fülhallgatókat, melyek a Bluetooth Auracast nevű funkciója segítségével lokális műsorszóróvá varázsolnak közösségi terekben elhelyezett tévéket és más taralomközvetítő eszközöket. A Washingtoni Egyetem kutatói azonban ennél sokkal izgalmasabbat raktak össze: olyan headsetet, amivel bármilyen zajos környezetben képesek leszünk csak egy valakit hallgatni (vagy kihallgatni?).

A zajszűrő fejhallgató nem újdonság. Van azonban a zajszűrésnek egy speciális esete, amire mindezidáig nem született igazán jó megoldás: hogyan oldjuk meg zajos tömegben, hogy csak egy valaki hangját halljuk? Az Apple AirPods Pro legújabb kiadásában van hasonló funkció, de annál sem lehet befolyásolni, hogy fókuszáltan csak egy valaki hangját engedje át a szűrője.

Segít a mesterséges intelligencia

Az egyetem kutatócsapata erre a speciális helyzetre talált megoldást. Kifejlesztettek egy MI-rendszert, amivel csak pár másodpercig kell "figyelni" a kiszemelt ember hangját, és utána a füles már csak az ő megszólalásait közvetíti, pontosabban kiemeli a környezet zajából. A Target Speech Hearing nevű rendszer ugyanis jó hatásfokkal halkítja el az egyéb zavaró hangot a környezet zajszintjétől függetlenül. Ráadásul az azonosítási procedúra után már arra sincs szükség, hogy a hallgatózónak közvetlen "rálátása" legyen a beszélőre.

A kutatók nem akarnak kereskedelmi terméket a találmányukból (egyelőre), sőt a proof of concept kódját közzé is tették a GitHubon, hogy mások továbbgondolhassák.

A rendszer egyik fontos eleme egy olyan headset, aminek mindkét oldalán van mikrofon. Viselője kiválasztja a hangforrást, majd megérint egy gombot, és 3-5 másodpercig a hangforrás irányába néz. Fontos, hogy a hangforrásból érkező hullámok közel egyszerre érkezzenek a két mikrofonhoz. A fejhallgató továbbítja a jelet egy beágyazott számítógépre, amelyen egy gépi tanulási szoftver megtanulja a hangmintát. Onnantól kezdve a hallgatózó a kiválasztott hangforrást hallja még akkor is, ha ő és a beszélő is folyamatosan mozog. Minél több mintát dolgoz fel a szoftver, annál tisztább lesz a hangkép.

A rendszert tesztelők átlagosan mintegy kétszer tisztábbnak, érhetőbbnek ítélték a rendszer továbbította hangokat, mint a szűrés nélkülieket.

Egyelőre szükség van Harry Caul trükkjeire

A rendszer persze közel sem tökéletes. Legnagyobb korlátja, hogy egyszerre csak egy hangforrást tud tisztítani – azaz már egy párbeszédet sem lehet vele kihallgatni. Szintén jelentős limitáció, hogy csak akkor lehet azonosítani egyértelműen a forrást, ha ugyanabból az irányból nem érkezik más hanghullám. Persze többszöri próbálkozással lehet javítani a hangminőségen.

És még egy: a kutatók nem kifejezetten másokat titokban kihallgatni vágyókra gondoltak, hanem például hallássérültek támogatására. Számukra egy ilyen funkcióval ellátott hallókészülék óriási segítséget jelentene például egy zsúfoltabb térben, ahol sokan beszélnek egyszerre viszonylag azonos hangerővel.

(Illusztráció: részlet Coppola filmjéből. Forrás: YouTube)

Piaci hírek

Szimulált elefántok leplezik le az önvezető rendszerek ügyetlenségét

Egy új benchmark azokat a megbízhatósági értékeléseket feszegeti, amelyekből nem igazán derül ki, hogy az önvezető modellek hogyan és milyen gyakran mondanak csődöt a váratlan helyzetekben.
 
Hirdetés

A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető

Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.