A meglévő technológiák nem tudnak mit kezdeni a magas hanggal, a fura beszédfordulatokkal és a felhasználói alkalmazkodás hiányával. Ezen segítene egy ír startup fejlesztése.

A 2013-ban alapított, Írországban működő SoapBox Labs célja, hogy saját meghatározása szerint "a világ legpontosabb és leginkább hozzáférhető beszédtechnológiáját" fejlessze ki a gyerekek számára. A startup létrejötte arra a felvetésre alapult, hogy a beszédfelismerő megoldások jellemzően a felnőtteknek készülnek, és a legfiatalabb felhasználókkal még a konzumer piac vezető termékei sem jól működnek együtt, mint amilyen mondjuk az Amazon Echo vagy a Google Home.

Nem úgy működnek, mint a felnőttek

A SoapBox a hardver- és alkalmazásfejlesztőket segítené technológiájával: a vállalkozás cloud alapú alkalmazásprogramozási felületének integrációjával a rendszereket vezérlő algoritmusok a gyerekek beszédét is annyira eredményesen dolgohatják fel, mint a felnőttekét. Ez érdekes lehet az olvasást vagy a nyelvi készségeket formáló appok számára, de a hangvezérlés már nagyon sok területen jelen van az IoT eszközöktől az okos otthoni kellékeken át a játékokig vagy a kiterjesztett valóságig.

A felnőttekkel összehasonlítva nyilvánvaló különbség, hogy a gyerekeknek magasabb a hangjuk, és gyakran használnak az elfogadottól teljesen eltérő beszédfordulatokat. Ráadásul nem is igazán zavartatják magukat, ha éppen egy géphez beszélnek: miközben a felnőttek akaratlanul is igyekeznek úgy alakítani saját kommunikációjukat, hogy a gépek (praktikusan a hangvezérelt digitális asszisztensek) minél hatékonyabban működjenek, addig a legkisebbek erre még nem igazán képesek.

A SoapBox Labs alapítója, Dr. Patricia Scanlon a Bell Labs korábbi munkatársa, és PhD fokozata mellett közel két évtizedes múltja van a beszédfelismerő rendszerek fejlesztésében. Elmondása szerint ebből a szempontból akkora a különbség a gyerekek és a felnőttek között, hogy az elmúlt néhány évben egy nagy csomó addigi kutatási eredményt kellett kihajítaniuk az ablakon, mivel a felnőttek vizsgálatára épülő modellek gyenge eredményekhez vezetnek, ha a kisebbekre alkalmazzák azokat – derül ki a TechCrunch riportjából.

Tudnia kell a gépnek, kivel áll szemben

A startup az elmúlt években saját adatkészletet épített kifejezetten a gyerekek vizsgálatával, amelyhez saját kutatások is társulnak a hang és a viselkedés jellemzésére. A cég platformja nem meglepő módon a mesterséges intelligencia (a gépi mély tanulás) lehetőségeire épül, ami a SoapBox által fejlesztett új modellekkel és értékelő algoritmusokkal együtt az eddigieknél sokkal pontosabb beszédfelismerő technológiához a gyerekekkel kapcsolatban.

Az angol nyelvű API elérhetővé tételére már sor került, a TechCrunch értesülései szerint pedig a közeljövőben néhány nagyszabású együttműködési megállapodás bejelentésére számíthatunk. A SoapBox Labs nemrég jutott több mint 2 millió euró befektetői forráshoz, hogy platformjára más nyelveket is elkezdjen bevezetni.

Érdekesség, hogy Dr. Scanlon szerint a gyerekek beszédét értelmező rendszerek, bár nehezebb fejleszteni azokat, egyáltalán nem működnek jobban a felnőttekre alkalmazva, vagyis a különbségek oda-vissza akadályt jelentenek. Éppen ezért a mostani tudásunk szerint két, egymástól elkülönült megoldásra lesz szüksége a hang alapú kommunikációra tervezett gépeknek. A későbbi eszközöknek meg kell állapítaniuk, hogy gyerek vagy felnőtt beszél hozzájuk, és aszerint kell váltogatniuk a felhasznált adatkészleteket.

A gépnek ráadásul ehhez kell majd igazítania az interakció lehetőségeit is, hiszen a gyerekekkel való hatékonyabb kommunikáció még nem jelenti, hogy a felnőttekével megegyező felhasználói jogosultságok járnának nekik.

Cloud & big data

Van az a pénz... Kivették a kínai App Store-ból a WhatsAppot és Threadset

Peking szerint a Meta két mobil appja nemzetbiztonsági aggályokat vet fel.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.