Egy startup cég állítása szerint fejlesztésük egészen minimális idő alatt képes megtanulni bárki beszédstílusát, hangtónusát, hogy utána bármilyen szöveget elmondhasson az illető hangján.

Beszédszintézissel foglalkozik a Lyrebird, állításuk szerint gépi tanulásra képes rendszere alig egy percnyi hanganyag elemzésével el tudja sajátítani bárki beszédstílusát. Ezt alátámasztandó a volt amerikai elnök, Barack Obama beszédstílusát mutató hangmintákkal rukkolt elő a cég, illetve a jelenlegi vezető Donald Trump és az elnökségért szintén versenybe szállt Hillary Clinton beszédét utánzó felvételeket is közzé tettek.

Áttörés a beszédfelismerésben
A Microsoft fejlesztette mesterséges intelligencia úgy képes értelmezni a szavakat egy beszélgetésből, ahogyan azt az emberek teszik.

A rendszer neurális hálózatokat használ az elképesztő mennyiségű adat feldolgozásához és a mintafelismeréshez. Ennek segítségével nem csak a beszédmegértés fejlődhet ugrásszerűen, hanem a beszéd szöveggé való átalakítása is.

Komoly biztonsági kockázatok

Alig egy évvel azután rukkoltak elő a fejlesztéssel, hogy a HSBC bank világszerte hangfelismerő technológiát kezdett alkalmazni, jelszavas hitelesítési eljárással kombinálva. A 2016-ban bevezetett biometrikus azonosítási formával nincsen teljesen egyedül a HSBC; beszámolók szerint a Barclays is tervezi felhasználását. Történt mindez annak ellenére, hogy számos, a témával foglalkozó kutatócsapat – például az Alamaba Egyetem szakértői - figyelmeztetett: kizárólag hangalapú azonosításra támaszkodva sebezhetővé válnak a védeni kívánt rendszerek.

A hangtorzító technológiák fejlődésével egy támadó gyakorlatilag mindössze pár mintavételezést követően le tudja utánozni a célszemély hangját. Ez aztán felhasználható az illető személyiségével való visszaélésekre, például olyan mondatok adhatók a szájába, amiket valójában sosem mondott, figyelmeztettek az egyetem kutatói.

És hogy milyen arányban eshetnek áldozatul az ilyen platformok az algoritmizált alapokon nyugvó támadásoknak? Az egyetem kutatócsapata szerint az általuk tesztelt hangalapú azonosítórendszerek átlagos szintetikusbeszédminta-elutasítási szintje mindössze 10-20 százalék között alakult, vagyis a próbálkozások döntő többsége sikerrel járt. Ráadásul ez az arány tovább javulhat (vagy romolhat, nézőpont kérdése), hívta fel a figyelmet Dr. Nitesh Saxena, az egyetem Security and Privacy In Emerging computing and networking Systems (SPIES) laboratóriumának igazgatója. Hiszen a hangutánzó, -szintetizáló algoritmusok fejlődésével még jobban leutánozhatóvá válik az emberi hang.

Megszűnik a hangfelvételek bizonyító ereje?

A Lybrebird jelenleg azon dolgozik, hogy létrehozzon egy olyan fejlesztői API-t, ami lehetővé teszi technológiája gyakorlatilag bármilyen alkalmazásba – például játékokba, de nyilvánvalóan akár malware-ekbe is – történő integrálását. Mielőtt azonban ezt közzé tennék, el akarják érni, hogy ne sérüljön a hangminták jelenlegi erős bizonyító ereje. Azzal ugyanis ők is tisztában vannak, hogy beszédszintézis eljárásuk a rosszindulatú felhasználók fantáziáját is megmozgatja.

Technológiánk nyilvánossá és mindenki számára elérhetővé tétele előtt biztosak akarunk lenni abban, hogy elkerüljük ezeket a kockázatokat, írták a fejlesztők, azt azonban nem részletezték, hogy miként tervezik ezt megvalósítani.

Nem a Lybrebird egyébként az egyetlen olyan vállalat, ami hatékony beszédszintézisen – és így a pusztán hangazonosításra alapuló védelmi rendszerek ellehetetlenítésén – dolgozik. A tudományos élet is egyre komolyabban foglalkozik a témával, szinte hónapról hónapra nő azon egyetemek száma, ahol beszédszintézisre alapuló kutatásokba kezdenek, szerte a világon.

Cloud & big data

Így árasztotta el az amerikai híroldalakat a pornó

Miután a VidMe nevű videómegosztó domainjét megvette egy pornós cég, több lap oldalán is felnőtt tartalmak kezdtek megjelenni.
 
Hirdetés

Belépő szinten dob nagyot a tároláson a Dell EMC PowerStore 500

Garantált 4:1-es deduplikációval, nagyobb teljesítménnyel, frissített szoftveres képességeivel teszi magasra a lécet a tárolókörnyezet modernizálásában és a gyorsan fejlődő adatigények kiszolgálásában a Dell EMC PowerStore. Beleértve az all flash termékcsalád legkisebb tagját is, amely megérkezett Magyarországra.

Hirdetés

Növekvő elvárások a szállodai Wi-Fi hálózatokkal szemben – hogyan biztosítható a versenyelőny?

A Wi-Fi ma már szinte valamennyi szálláshelyen alapvető szolgáltatás. Ezzel arányosan a vendégértékeléseknek is javuló tendenciát kellene mutatniuk – mégsem ez a helyzet. Mit hiányolnak a vendégek, és hogyan biztosíthatja egy szálloda a legújabb vendégigényeknek történő megfelelőséget? Ennek járt utána egy a lezárások után készült friss kutatás.

Radikális átalakulást és innovációs kényszert hozott a szállodaiparban a COVID.

a melléklet támogatója a TP-Link

CIO KUTATÁS

A PANDÉMIA HATÁSAIRÓL

Az ön véleményére is számítunk a Corvinus Egyetem Informatikai Intézetével végzett kutatásunkban. Segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

MEHET

A KPMG immár 22. alkalommal kiadott CIO Survey jelentése szerint idén az informatikai vezetők leginkább a digitalizációra, a biztonságra és a szoftverszolgáltatásokra koncentráltak.

Használtszoftver-kereskedelem a Brexit után

Az EU Tanácsa szerint összeegyeztethető a backdoor és a biztonság. Az ötlet alapjaiban hibás. Pfeiffer Szilárd fejlesztő, IT-biztonsági szakértő írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2021 Bitport.hu Média Kft. Minden jog fenntartva.