Bár a számítógépek manapság már a telefonjainkba is beköltöztek, sokan még mindig nem tudnak arról, hány területen használhatjuk már saját hangunkat is a velük való kommunikációban.
Hirdetés
 
Az informatika általánossá válása közben egyvalami szinte mindenhol ugyanolyan maradt a kezdetek óta, méghozzá a szövegek bevitele. Billentyűzeten pötyögjük be a szavakat, és a képernyőn keresgélve kattintgatjuk le vagy írjuk le a parancsokat. Bár az még mindig messze van, hogy kedélyesen elbeszélgessünk saját házi robotunkkal, de már manapság is több helyen használjuk a digitális beszédfelismerés valamilyen formáját, csak épp nem tudunk róla.


Egy biztos: ne így kezdjünk hozzá...

Alapszintű nyelvtudás Az automatikus beszédfelismerés (Advanced Speech Recognition, ASR) több szinten létező tudomány. A legfelsőbb szint természetesen az lenne, ha egy számítógép azonnal megismerné és megértené minden szavunkat, ezért diktálhatnánk ugyanúgy, mintha a titkárnőnknek mondanánk valamilyen folyó szöveget. Ehelyett a manapság létező diktálóprogramokba még mindig kissé körülményesen, speciális módon kell "belepréselni" a mondanivalónkat, valahogy így:

"Ehelyett a manapság létező diktálóprogramokba még mindig kissé körülményesen VESSZŐ speciális módon kell IDÉZŐJEL belepréselni IDÉZŐJEL a mondanivalónkat VESSZŐ valahogy így KETTŐSPONT SORTÖRÉS."

Látható, hogy, bár vannak már kifejezetten diktálásra kifejlesztett szoftverek, ezek használatához még mindig alapos betanulás szükséges. Ez ráadásul nem csak a felhasználót érinti, hanem magát a szoftvert is: hosszú hangmintavételezési procedúra során kell előre megadott szavakat, mondatokat beolvasnunk, hogy a gép megjegyezze saját hangkarakterünket, beszédmodorunkat.

Félszavakból is A beszédfelismerés sokkal jobban működik olyan környezetekben, ahol nem egy teljes nyelvi szókészletet kell felismernie és értelmeznie a gépnek. Jó példa ezekre a főként angol nyelvterületen használt üzenetrögzítők illetve telefonos "útválasztók" új generációja. Itt már nem a telefon billentyűzetének megnyomásával kell opciókat választani, hanem a gép által felkínált lehetőségek valamelyikét szóban kell bemondanunk. Ilyenkor jóval kevesebb a válaszadási lehetőség (gyakran a yes / no lehetőségekre korlátozódik), ezért a válaszok detektálása sokkal egyszerűbb.

Az ASR egyik legfrissebb felhasználási területei az okostelefonok hang alapú keresési és vezérlési szolgáltatásai. Az iPhone-okon is elérhető ilyen megoldás, ám a szakértők szerint az Android még nagyobb lehetőség előtt áll a Google hatalmas szöveges keresési adatbázisának köszönhetően.

A képre kattintva az infografika eredeti méretben, új ablakban nyílik meg


Forrás: Medicaltranscription, Mashable

Támadás az okostelefonok ellen [infografika]
Jövőkép: mi az a "dolgok internete?" [infografika]
Az email rövid története - grafikus kronológia

A Google is rálépett az Anthropic kijelölte útra

Az OpenAI után a DeepMind is az MI-startup szabványát használja a modellek és az adatok összekapcsolására.
 
A mesterséges intelligencia új korszakába léptünk. A generatív MI nem csupán kísérleti technológia. Sok cég stratégiai eszköznek tekinti, amely segít a versenyképesség megőrzésében, javításában.

a melléklet támogatója a One Solutions

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.