Világszerte megnőtt az az idő, amit a gyerekek a képernyő előtt töltenek, derült ki az amerikai Forbes egy májusban publikált cikkéből. Ennek részben a távoktatás az oka. A gyerekek számára azonban a különböző (informatikai) kütyük kezelése közel sem olyan egyszerű, mint azt a felnőttek szeretik hangoztatni, a beviteli eszközök, kezelőfelületek fejlesztői ugyanis nem az ő tudásukra, igényeikre gondoltak. De semmi gond, itt vannak a természetes nyelvi feldolgozásra épülő rendszerek, az intelligens hangasszisztensek!
A TechCrunchon Patricia Scanlon, a gyerekeknek beszédfelismerésen alapuló technológiákat fejlesztő, dublini székhelyű SoapBox Labs alapító-vezetője foglalkozott kimerítően a témával. Mint írja, szeretünk rácsodálkozni, hogy a digitális bennszülöttek számára mennyire kézre áll a technológia, de gyorsan kiderül, hogy a kezelőfelületek nem nekik készültek, ami például a távoktatásnál nehézségeket okozhat.
A gyerekszáj kifog az MI-n
Emiatt sokan a hangalapú digitális asszisztensektől várták, hogy surlódásmentessé teszik a gyerekek és a technológia együttműködését. Aztán elég gyorsan szembesülhettek azzal, hogy az Alexa vagy Siri nem igazán tud mit kezdeni a gyerekek kérdéseivel, kéréseivel, utasításaival.
A beszédfelismerő szoftvereket ugyanis szintén nem ilyen fiatal korosztályra tervezték. A gyerekeknek fiziológiai okokból más a hangmagassága, hangszíne, máshogy intonálnak, másként szerkesztik a mondatokat, mint a felnőttek. Tovább bonyolítja a problémát a gyerekek beszédének nyelvi struktúrája. Hiányoznak belőle a felnőtteknél természetesnek vett szintaktikai következetességek – például egy gyereknél könnyen előfordulhat, hogy összetett szavakat fordított sorrendben rak össze (madártoll – tollmadár), nem vagy rosszul használ ragokat. Ezek az eltérések a köznyelvi sztenderdtől ráadásul nem mutatnak általános mintákat. Mindezeket együtt a jelenlegi természetes nyelvi feldolgozó algoritmusok nem képesek kezelni.
És akkor még ott van az a probléma, hogy ezek az eltérések a korral is változnak, ráadásul meglehetősen gyorsan, egy négyéves egészen másként beszél, mint egy ötéves vagy hatéves. Mindezeket a természetes nyelvi feldolgozó rendszereknél nem vették figyelembe, hiszen képességeiket alapvetően a felnőttek, azaz a többé-kevésbé egységes köznyelvet beszélők mintázatai alapján szerezték.
Összességében a gyerekek beszéde sokkal szabálytalanabb, mint a felnőtteké – és minél fiatalabbak, annál inkább eltér a nyelvi sztendertől –, hiszen még csak tanulják, amit a felnőttek már elsajátítottak: hogyan lehet a legjobban kommunikálni, hogyan lehet például úgy kérdést feltenni, hogy a minket érdeklő dologra kapjunk választ, akár egy hangasszisztenstől.
Mindebből azonban az következik, hogy pont azoknál a legnehezebb alkalmazni a beszédfelismerést, akik a legtöbbet profitálhatnának belőle, mert a legnehezebben kezelik a hagyományos felületeket.
Újra kell gondolni a beszédfelismerést
Ahhoz, hogy a gyermekek nyelvi változatosságához lehessen igazítani a beszédfelismerő rendszereket, magát a beszédfelismerést kell újragondolni, írja Scanlon. Nem arról van szó, hogy egy újabb "dialektust" kell megtanítani a szoftvereknek. Valahogy bele kell kódolni a beszédfelismerésbe azt is, hogy a gyermekek nyelvhasználata nagyon gyorsan fejlődik, és a hangképzésük fiziológiai háttere is változik (gondoljunk csak a kamaszfiúk mutálására).
De van a problémának egy pszichológiai oldala is, amivel szintén kellene valamit kezdeni. Scanlon szerint hat a gyerekek pszichikai fejlődésére, hogy egy Alexa vagy Siri típusú rendszer hogyan reagál a kérdéseikre, kijelentéseikre. Még a válaszok pontosságnak is más a súlya esetükben, mint a felnőtteknél. Az például negatívan befolyásolja szellemi és pszichés fejlődésüket, ha a rendszer téved a kárukra, és fals negatív vagy fals pozitív választ ad. És akkor még ott van az a romboló társadalmi hatás, amit a hangasszisztensek előítéletessége vált ki (Scanlon itt egy idén tavasszal publikált amerikai tanulmányra hivatkozik, mely szerint a digitális asszisztensek többet tévesztenek az afroamerikaiak esetében, mint a fehér amerikaiaknál).
Pedig a beszédfelismerés hatékony eszköz lehet a gyerekek számára az otthoni tanulásban és az osztályteremben egyaránt. Segíthet leküzdeni a gyermekek hiányosságait az írás-olvasás és a nyelvtanulás szakaszaiban. A mai beszédfelismerő eszközök többsége azonban erre alkalmatlan, állítja Patricia Scanlon.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak