A gyerekek zavarba hozzák a mesterséges intelligenciát

Bitport2018.01.16.Cloud & big data

A meglévő technológiák nem tudnak mit kezdeni a magas hanggal, a fura beszédfordulatokkal és a felhasználói alkalmazkodás hiányával. Ezen segítene egy ír startup fejlesztése.

A 2013-ban alapított, Írországban működő SoapBox Labs célja, hogy saját meghatározása szerint "a világ legpontosabb és leginkább hozzáférhető beszédtechnológiáját" fejlessze ki a gyerekek számára. A startup létrejötte arra a felvetésre alapult, hogy a beszédfelismerő megoldások jellemzően a felnőtteknek készülnek, és a legfiatalabb felhasználókkal még a konzumer piac vezető termékei sem jól működnek együtt, mint amilyen mondjuk az Amazon Echo vagy a Google Home.

Nem úgy működnek, mint a felnőttek

A SoapBox a hardver- és alkalmazásfejlesztőket segítené technológiájával: a vállalkozás cloud alapú alkalmazásprogramozási felületének integrációjával a rendszereket vezérlő algoritmusok a gyerekek beszédét is annyira eredményesen dolgohatják fel, mint a felnőttekét. Ez érdekes lehet az olvasást vagy a nyelvi készségeket formáló appok számára, de a hangvezérlés már nagyon sok területen jelen van az IoT eszközöktől az okos otthoni kellékeken át a játékokig vagy a kiterjesztett valóságig.

A felnőttekkel összehasonlítva nyilvánvaló különbség, hogy a gyerekeknek magasabb a hangjuk, és gyakran használnak az elfogadottól teljesen eltérő beszédfordulatokat. Ráadásul nem is igazán zavartatják magukat, ha éppen egy géphez beszélnek: miközben a felnőttek akaratlanul is igyekeznek úgy alakítani saját kommunikációjukat, hogy a gépek (praktikusan a hangvezérelt digitális asszisztensek) minél hatékonyabban működjenek, addig a legkisebbek erre még nem igazán képesek.

A SoapBox Labs alapítója, Dr. Patricia Scanlon a Bell Labs korábbi munkatársa, és PhD fokozata mellett közel két évtizedes múltja van a beszédfelismerő rendszerek fejlesztésében. Elmondása szerint ebből a szempontból akkora a különbség a gyerekek és a felnőttek között, hogy az elmúlt néhány évben egy nagy csomó addigi kutatási eredményt kellett kihajítaniuk az ablakon, mivel a felnőttek vizsgálatára épülő modellek gyenge eredményekhez vezetnek, ha a kisebbekre alkalmazzák azokat – derül ki a TechCrunch riportjából.

Tudnia kell a gépnek, kivel áll szemben

A startup az elmúlt években saját adatkészletet épített kifejezetten a gyerekek vizsgálatával, amelyhez saját kutatások is társulnak a hang és a viselkedés jellemzésére. A cég platformja nem meglepő módon a mesterséges intelligencia (a gépi mély tanulás) lehetőségeire épül, ami a SoapBox által fejlesztett új modellekkel és értékelő algoritmusokkal együtt az eddigieknél sokkal pontosabb beszédfelismerő technológiához a gyerekekkel kapcsolatban.

Az angol nyelvű API elérhetővé tételére már sor került, a TechCrunch értesülései szerint pedig a közeljövőben néhány nagyszabású együttműködési megállapodás bejelentésére számíthatunk. A SoapBox Labs nemrég jutott több mint 2 millió euró befektetői forráshoz, hogy platformjára más nyelveket is elkezdjen bevezetni.

Érdekesség, hogy Dr. Scanlon szerint a gyerekek beszédét értelmező rendszerek, bár nehezebb fejleszteni azokat, egyáltalán nem működnek jobban a felnőttekre alkalmazva, vagyis a különbségek oda-vissza akadályt jelentenek. Éppen ezért a mostani tudásunk szerint két, egymástól elkülönült megoldásra lesz szüksége a hang alapú kommunikációra tervezett gépeknek. A későbbi eszközöknek meg kell állapítaniuk, hogy gyerek vagy felnőtt beszél hozzájuk, és aszerint kell váltogatniuk a felhasznált adatkészleteket.

A gépnek ráadásul ehhez kell majd igazítania az interakció lehetőségeit is, hiszen a gyerekekkel való hatékonyabb kommunikáció még nem jelenti, hogy a felnőttekével megegyező felhasználói jogosultságok járnának nekik.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Elon Musk egyelőre kudarcot vallott az OpenAI ostromával

Az üzletember elvesztette az MI-fejlesztő vállalat ellen indított perét, miután az esküdtszék megállapította, hogy túl sokáig várt az OpenAI vezetőit és működését is célzó, sokmilliárd dolláros kereset benyújtásával. Musk ügyvédje szerint azonban messze még a vége, és a fellebbezést követően ők nyerik majd a háborút.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

a melléklet támogatója a ONE Solutions

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Elon Musk egyelőre kudarcot vallott az OpenAI ostromával

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!