Kereken ötven éve mutatták be Francis Ford Coppola remek thrillerét, a Magánbeszélgetéseket. A film főhőse egy profi "hallgatózó", Harry Caul (Gene Hackman egyik legnagyobb alakítása), aki akár egy zajos téren sétálgató pár beszélgetését is képes rögzíteni saját fejlesztésű különleges eszközeivel. Ha ma szeretne valaki Harry Caul bőrébe bújni, sokkal egyszerűbb dolga lenne.
Januárban a CES-en már bemutattak olyan fülhallgatókat, melyek a Bluetooth Auracast nevű funkciója segítségével lokális műsorszóróvá varázsolnak közösségi terekben elhelyezett tévéket és más taralomközvetítő eszközöket. A Washingtoni Egyetem kutatói azonban ennél sokkal izgalmasabbat raktak össze: olyan headsetet, amivel bármilyen zajos környezetben képesek leszünk csak egy valakit hallgatni (vagy kihallgatni?).
A zajszűrő fejhallgató nem újdonság. Van azonban a zajszűrésnek egy speciális esete, amire mindezidáig nem született igazán jó megoldás: hogyan oldjuk meg zajos tömegben, hogy csak egy valaki hangját halljuk? Az Apple AirPods Pro legújabb kiadásában van hasonló funkció, de annál sem lehet befolyásolni, hogy fókuszáltan csak egy valaki hangját engedje át a szűrője.
Segít a mesterséges intelligencia
Az egyetem kutatócsapata erre a speciális helyzetre talált megoldást. Kifejlesztettek egy MI-rendszert, amivel csak pár másodpercig kell "figyelni" a kiszemelt ember hangját, és utána a füles már csak az ő megszólalásait közvetíti, pontosabban kiemeli a környezet zajából. A Target Speech Hearing nevű rendszer ugyanis jó hatásfokkal halkítja el az egyéb zavaró hangot a környezet zajszintjétől függetlenül. Ráadásul az azonosítási procedúra után már arra sincs szükség, hogy a hallgatózónak közvetlen "rálátása" legyen a beszélőre.
A kutatók nem akarnak kereskedelmi terméket a találmányukból (egyelőre), sőt a proof of concept kódját közzé is tették a GitHubon, hogy mások továbbgondolhassák.
A rendszer egyik fontos eleme egy olyan headset, aminek mindkét oldalán van mikrofon. Viselője kiválasztja a hangforrást, majd megérint egy gombot, és 3-5 másodpercig a hangforrás irányába néz. Fontos, hogy a hangforrásból érkező hullámok közel egyszerre érkezzenek a két mikrofonhoz. A fejhallgató továbbítja a jelet egy beágyazott számítógépre, amelyen egy gépi tanulási szoftver megtanulja a hangmintát. Onnantól kezdve a hallgatózó a kiválasztott hangforrást hallja még akkor is, ha ő és a beszélő is folyamatosan mozog. Minél több mintát dolgoz fel a szoftver, annál tisztább lesz a hangkép.
A rendszert tesztelők átlagosan mintegy kétszer tisztábbnak, érhetőbbnek ítélték a rendszer továbbította hangokat, mint a szűrés nélkülieket.
Egyelőre szükség van Harry Caul trükkjeire
A rendszer persze közel sem tökéletes. Legnagyobb korlátja, hogy egyszerre csak egy hangforrást tud tisztítani – azaz már egy párbeszédet sem lehet vele kihallgatni. Szintén jelentős limitáció, hogy csak akkor lehet azonosítani egyértelműen a forrást, ha ugyanabból az irányból nem érkezik más hanghullám. Persze többszöri próbálkozással lehet javítani a hangminőségen.
És még egy: a kutatók nem kifejezetten másokat titokban kihallgatni vágyókra gondoltak, hanem például hallássérültek támogatására. Számukra egy ilyen funkcióval ellátott hallókészülék óriási segítséget jelentene például egy zsúfoltabb térben, ahol sokan beszélnek egyszerre viszonylag azonos hangerővel.
(Illusztráció: részlet Coppola filmjéből. Forrás: YouTube)
Exkluzív szakmai nap a felhők fölött: KYOCERA Roadshow a MOL Toronyban
A jövő irodája már nem a jövő – hanem a jelen. A digitális transzformáció új korszakába lépünk, és ebben a KYOCERA nemcsak követi, hanem formálja is az irányt. Most itt a lehetőség, hogy első kézből ismerje meg a legújabb hardveres és szoftveres fejlesztéseket, amelyekkel a KYOCERA új szintre emeli a dokumentumkezelést és az üzleti hatékonyságot.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak