A Google I/O konferenciáján nemrég mutatkozott be az Assistand digitális segéd Duplex nevű kiterjesztése. A vállalat vezérigazgatójának prezentációja olyan telefonhívások felvételeinek lejátszásával hozta lázba a közönséget, amelyek során az MI étteremben és fodrásznál foglalt időpontokat a felhasználók nevében. A mesterséges intelligencia nem csak hibátlanul értelmezte a telefon másik végén lévő alkalmazottak mondanivalóját, de meglepően emberi gesztusok révén teljes egészében azt a látszatot keltette, hogy a vonal túlső felén is egy emberi szereplő vesz részt a társalgásban.
A demóról már mindenki mindent elmondott, amit el lehetett mondani, mi ebben a cikkben foglalkoztunk a Duplexszel. Bár a technológiát a társaságot irányító Sundar Pichai sem nevezte még piacérettnek, abban biztosak lehetünk, hogy nemsokára valóban az emberi kommunikációt tökéletesen másoló algoritmusok fognak megszólalni a telefonban (ha nem is magyarul). A Deloitte szerint tavaly 12 milliárd dollárnak megfelelő források áramlottak a mesterséges intelligencia kutatásába, ami 2021-re az 57 milliárdot is meghaladja majd, vagyis a techcégek valóságos fegyverkezési versenyben vannak ezen a területen.
Két tökéletes beszélgetés
Mindez nyilvánvaló etikai kérdéseket is felvet, amelyek között az emberi beszédet másoló robotok szabályozása még nem is tűnik a legjelentősebb problémának. A Vanity Fair vonatkozó összeállításában például szerepel az a kísérlet, amely YouTube-videókba ágyazott, az emberi hallástartományon kívül eső utasításokkal vásárlásokra bírja az Amazon Alexa asszisztensét. A közelmúltban az is kiderült (gondoljunk például a Facebook botrányaira), hogy a gépi tanulás gyors fejlődésével milyen lehetőségek nyílnak a tömeges manipulációt célzó kampányok előtt.
A sort még hosszan folytathatnánk az autonóm járművekkel, a teljesen automatizált boltokkal, a fogyasztói viselkedés személyes adatokra épülő predikciójával vagy az okos otthonokkal. A Google mostani demója kapcsán azonban már sokkal aktuálisabb etikai aggályok is felmerültek: nevezetesen, hogy a Duplex tényleg képes mindarra, amit a bemutatón hallhattunk, vagy a társaság kicsit megvajazta a még be nem vezetett technológia (deklaráltan valódi beszélgetéseket tartalmazó) felvételeit.
Az Axios oldalán megjelent cikkben egy sor olyan szempontot sorolnak fel, amelynek alapján a felvételek túlságosan jól sikerültnek (értsd: megrendezettnek vagy szerkesztettnek) tűnhetnek. Ilyen például, hogy a fodrászatban "Helló, miben segíthetek?", az étteremben pedig "Üdv, segíthetek?" bemondással veszik fel a telefont. Az Axios munkatársai erre felhívtak egy tucat éttermet és fodrászatot (köztük olyanokat is, amelyek a Google székhelyén, Mountain View-ban működnek), és kivétel nélkül azt tapasztalták, hogy az alkalmazottak az üzletek nevét is megadják, amikor hívást fogadnak.
Várnak a hivatalos válaszokra
Felmerült továbbá, hogy a beszélgetések során nem hallatszik semmiféle háttérzaj, ami a fodrászatokra és éttermekre nem igazán jellemző; ezzel kapcsolatban elismerik, hogy az általuk hívott vállalkozásokra a háttérzaj csak jellemző volt, de nem volt mindenegyes esetben hallható. Felvetik ugyanakkor, hogy egyik helyen sem érdeklődtek semmilyen kontakt információ után – sem az ügyfél teljes nevére, sem a telefonszámára vagy más elérhetőségére nem voltak kíváncsiak.
Mindehhez adjuk hozzá, hogy Kaliforniában mindkét fél beleegyezésére szükség van egy telefonbeszélgetés rögzítéséhez. Mivel ilyesmi a demóban nem volt hallható, a Google pedig valószínűleg nem követne el ilyen hibát, az Axios ismét csak felveti, hogy a Google nem teljesen élő és spontán felvételeket tett közzé. Mindez természetesen nem jelenti, hogy a Duplex nem képes, vagy a nagyon közeli jövőben nem lesz képes pont ugyanilyen beszélgetések lefolytatására, de Sundar Pichai a bemutatón akkor is úgy aratott elsöprő sikert, hogy teljesen valódinak nevezte a hívásokat.
A lap természetesen a Google-t is megkérdezte, ám a fent felvetések egyikre sem kapott még választ, beleértve a hívásokban szereplő vállalkozások azonosítását. Az esetleges kozmetika persze nem sokban változtatná meg a benyomásokat, legfeljebb anyit jelentene, hogy a Google nem most, hanem holnap fog ugyanilyen eredményeket produkálni.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak