Kereken ötven éve mutatták be Francis Ford Coppola remek thrillerét, a Magánbeszélgetéseket. A film főhőse egy profi "hallgatózó", Harry Caul (Gene Hackman egyik legnagyobb alakítása), aki akár egy zajos téren sétálgató pár beszélgetését is képes rögzíteni saját fejlesztésű különleges eszközeivel. Ha ma szeretne valaki Harry Caul bőrébe bújni, sokkal egyszerűbb dolga lenne.
Januárban a CES-en már bemutattak olyan fülhallgatókat, melyek a Bluetooth Auracast nevű funkciója segítségével lokális műsorszóróvá varázsolnak közösségi terekben elhelyezett tévéket és más taralomközvetítő eszközöket. A Washingtoni Egyetem kutatói azonban ennél sokkal izgalmasabbat raktak össze: olyan headsetet, amivel bármilyen zajos környezetben képesek leszünk csak egy valakit hallgatni (vagy kihallgatni?).
A zajszűrő fejhallgató nem újdonság. Van azonban a zajszűrésnek egy speciális esete, amire mindezidáig nem született igazán jó megoldás: hogyan oldjuk meg zajos tömegben, hogy csak egy valaki hangját halljuk? Az Apple AirPods Pro legújabb kiadásában van hasonló funkció, de annál sem lehet befolyásolni, hogy fókuszáltan csak egy valaki hangját engedje át a szűrője.
Segít a mesterséges intelligencia
Az egyetem kutatócsapata erre a speciális helyzetre talált megoldást. Kifejlesztettek egy MI-rendszert, amivel csak pár másodpercig kell "figyelni" a kiszemelt ember hangját, és utána a füles már csak az ő megszólalásait közvetíti, pontosabban kiemeli a környezet zajából. A Target Speech Hearing nevű rendszer ugyanis jó hatásfokkal halkítja el az egyéb zavaró hangot a környezet zajszintjétől függetlenül. Ráadásul az azonosítási procedúra után már arra sincs szükség, hogy a hallgatózónak közvetlen "rálátása" legyen a beszélőre.
A kutatók nem akarnak kereskedelmi terméket a találmányukból (egyelőre), sőt a proof of concept kódját közzé is tették a GitHubon, hogy mások továbbgondolhassák.
A rendszer egyik fontos eleme egy olyan headset, aminek mindkét oldalán van mikrofon. Viselője kiválasztja a hangforrást, majd megérint egy gombot, és 3-5 másodpercig a hangforrás irányába néz. Fontos, hogy a hangforrásból érkező hullámok közel egyszerre érkezzenek a két mikrofonhoz. A fejhallgató továbbítja a jelet egy beágyazott számítógépre, amelyen egy gépi tanulási szoftver megtanulja a hangmintát. Onnantól kezdve a hallgatózó a kiválasztott hangforrást hallja még akkor is, ha ő és a beszélő is folyamatosan mozog. Minél több mintát dolgoz fel a szoftver, annál tisztább lesz a hangkép.
A rendszert tesztelők átlagosan mintegy kétszer tisztábbnak, érhetőbbnek ítélték a rendszer továbbította hangokat, mint a szűrés nélkülieket.
Egyelőre szükség van Harry Caul trükkjeire
A rendszer persze közel sem tökéletes. Legnagyobb korlátja, hogy egyszerre csak egy hangforrást tud tisztítani – azaz már egy párbeszédet sem lehet vele kihallgatni. Szintén jelentős limitáció, hogy csak akkor lehet azonosítani egyértelműen a forrást, ha ugyanabból az irányból nem érkezik más hanghullám. Persze többszöri próbálkozással lehet javítani a hangminőségen.
És még egy: a kutatók nem kifejezetten másokat titokban kihallgatni vágyókra gondoltak, hanem például hallássérültek támogatására. Számukra egy ilyen funkcióval ellátott hallókészülék óriási segítséget jelentene például egy zsúfoltabb térben, ahol sokan beszélnek egyszerre viszonylag azonos hangerővel.
(Illusztráció: részlet Coppola filmjéből. Forrás: YouTube)
Így újult meg Magyarország leggyorsabb mobilhálózata
Közel 100 milliárd forintos beruházással, a rádiós és maghálózat teljes modernizációjával zárult le a Yettel történetének egyik legnagyobb műszaki fejlesztése.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak