A legfiatalabb korosztálynak lenne a legnagyobb szükségük az intelligens hangasszisztensekre és a hangvezérlésre, de épp őket nem tudja a technológia segíteni.

Világszerte megnőtt az az idő, amit a gyerekek a képernyő előtt töltenek, derült ki az amerikai Forbes egy májusban publikált cikkéből. Ennek részben a távoktatás az oka. A gyerekek számára azonban a különböző (informatikai) kütyük kezelése közel sem olyan egyszerű, mint azt a felnőttek szeretik hangoztatni, a beviteli eszközök, kezelőfelületek fejlesztői ugyanis nem az ő tudásukra, igényeikre gondoltak. De semmi gond, itt vannak a természetes nyelvi feldolgozásra épülő rendszerek, az intelligens hangasszisztensek!

A TechCrunchon Patricia Scanlon, a gyerekeknek beszédfelismerésen alapuló technológiákat fejlesztő, dublini székhelyű SoapBox Labs alapító-vezetője foglalkozott kimerítően a témával. Mint írja, szeretünk rácsodálkozni, hogy a digitális bennszülöttek számára mennyire kézre áll a technológia, de gyorsan kiderül, hogy a kezelőfelületek nem nekik készültek, ami például a távoktatásnál nehézségeket okozhat.

A gyerekszáj kifog az MI-n

Emiatt sokan a hangalapú digitális asszisztensektől várták, hogy surlódásmentessé teszik a gyerekek és a technológia együttműködését. Aztán elég gyorsan szembesülhettek azzal, hogy az Alexa vagy Siri nem igazán tud mit kezdeni a gyerekek kérdéseivel, kéréseivel, utasításaival.

A beszédfelismerő szoftvereket ugyanis szintén nem ilyen fiatal korosztályra tervezték. A gyerekeknek fiziológiai okokból más a hangmagassága, hangszíne, máshogy intonálnak, másként szerkesztik a mondatokat, mint a felnőttek. Tovább bonyolítja a problémát a gyerekek beszédének nyelvi struktúrája. Hiányoznak belőle a felnőtteknél természetesnek vett szintaktikai következetességek – például egy gyereknél könnyen előfordulhat, hogy összetett szavakat fordított sorrendben rak össze (madártoll – tollmadár), nem vagy rosszul használ ragokat. Ezek az eltérések a köznyelvi sztenderdtől ráadásul nem mutatnak általános mintákat. Mindezeket együtt a jelenlegi természetes nyelvi feldolgozó algoritmusok nem képesek kezelni.

És akkor még ott van az a probléma, hogy ezek az eltérések a korral is változnak, ráadásul meglehetősen gyorsan, egy négyéves egészen másként beszél, mint egy ötéves vagy hatéves. Mindezeket a természetes nyelvi feldolgozó rendszereknél nem vették figyelembe, hiszen képességeiket alapvetően a felnőttek, azaz a többé-kevésbé egységes köznyelvet beszélők mintázatai alapján szerezték.

Összességében a gyerekek beszéde sokkal szabálytalanabb, mint a felnőtteké – és minél fiatalabbak, annál inkább eltér a nyelvi sztendertől –, hiszen még csak tanulják, amit a felnőttek már elsajátítottak: hogyan lehet a legjobban kommunikálni, hogyan lehet például úgy kérdést feltenni, hogy a minket érdeklő dologra kapjunk választ, akár egy hangasszisztenstől.

Mindebből azonban az következik, hogy pont azoknál a legnehezebb alkalmazni a beszédfelismerést, akik a legtöbbet profitálhatnának belőle, mert a legnehezebben kezelik a hagyományos felületeket.

Újra kell gondolni a beszédfelismerést

Ahhoz, hogy a gyermekek nyelvi változatosságához lehessen igazítani a beszédfelismerő rendszereket, magát a beszédfelismerést kell újragondolni, írja Scanlon. Nem arról van szó, hogy egy újabb "dialektust" kell megtanítani a szoftvereknek. Valahogy bele kell kódolni a beszédfelismerésbe azt is, hogy a gyermekek nyelvhasználata nagyon gyorsan fejlődik, és a hangképzésük fiziológiai háttere is változik (gondoljunk csak a kamaszfiúk mutálására).

De van a problémának egy pszichológiai oldala is, amivel szintén kellene valamit kezdeni. Scanlon szerint hat a gyerekek pszichikai fejlődésére, hogy egy Alexa vagy Siri típusú rendszer hogyan reagál a kérdéseikre, kijelentéseikre. Még a válaszok pontosságnak is más a súlya esetükben, mint a felnőtteknél. Az például negatívan befolyásolja szellemi és pszichés fejlődésüket, ha a rendszer téved a kárukra, és fals negatív vagy fals pozitív választ ad. És akkor még ott van az a romboló társadalmi hatás, amit a hangasszisztensek előítéletessége vált ki (Scanlon itt egy idén tavasszal publikált amerikai tanulmányra hivatkozik, mely szerint a digitális asszisztensek többet tévesztenek az afroamerikaiak esetében, mint a fehér amerikaiaknál).

Pedig a beszédfelismerés hatékony eszköz lehet a gyerekek számára az otthoni tanulásban és az osztályteremben egyaránt. Segíthet leküzdeni a gyermekek hiányosságait az írás-olvasás és a nyelvtanulás szakaszaiban. A mai beszédfelismerő eszközök többsége azonban erre alkalmatlan, állítja Patricia Scanlon.

Közösség & HR

Van az a pénz... Kivették a kínai App Store-ból a WhatsAppot és Threadset

Peking szerint a Meta két mobil appja nemzetbiztonsági aggályokat vet fel.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.