A mesterséges intelligencia felfutása pedig tovább súlyosbíthatja azt a helyzetet, hogy számos, sokak által beszélt nyelv szinte nem is létezik az online térben.
Hirdetés
 

A Világbank adatai alapján ma már több mint 5 milliárd embernek van valamilyen szintű hozzáférése az internethez, kik értelemszerűen több ezer különböző nyelvet beszélhetnek. Talán nem meglepő, ha ezek közül néhányat a világhálón is nehezebb megtalálni a többinél, a népességhez viszonyított elérhetőségük azonban így is jelentős felül- és alulreprezentáltságot mutat: az angol, a német és a japán például sokkal gyakoribb, mint azt az anyanyelvi beszélők száma indokolná, miközben az Európán kívüli nyelvek közül sok olyan van, ami gyakorlatilag nem is létezik a neten – derül ki a Rest of World nemrég közzétett beszámolójából.

A lap az ausztriai székhelyű W3Techs segítségével vette számba a nyilvánosan elérhető webcímeket, és azzal együtt is hatalmas egyenlőtlenségeket talált a nyelvhasználatban, hogy a megvizsgált publikus tartalom nyilvánvalóan a teljes hálózatnak csak a töredékét reprezentálja. A vizsgálatok mindenesetre azt mutatták, hogy a webhelyek több mint fele használja az angolt elsődleges nyelvként, miközben az angol anyanyelvűek a világ népességének legfeljebb 5 százalékát teszik ki. A kínai és a hindi ezzel szemben a domainek 1,4, illetve 0,07 százalékát adja, és több száz millió ember által beszélt nyelveket (bengáli, urdu) szinte lehetetlen megtalálni a neten.

Egyre gyorsabban haladunk a rossz irányba

A Rest of World cikke emlékeztet rá, hogy az UNESCO már 2003-ban arra szólította fel az állami és a magánszektor szereplőit, hogy tartsanak fenn online tartalmakat az emberi nyelvek teljes skáláján. Az internet bővülésével azonban a beszélt és az online használt nyelvek közti szakadék egyre csak növekedett, és a tendencia abba az irányba mutat, hogy belátható időn belül csak néhány nyelvnek lesz érdemi jelenléte a világhálón. Az UNESCO szerint 15 év múlva már csak 5-10 olyan nyelv marad, amit prominens módon beszélnek és használnak a neten és az üzleti életben és a neten is, amit a szervezet értelemszerűen aggasztó kilátásnak tart.

A W3Techs aktuális adatai alapján most is csak 14 nyelv található meg a domainek több mint 1 százalékán. Ezzel kapcsolatban azért ki kell emelni, hogy a bejelentkezéssel védett tartalom (online alkalmazások, közösségi hálózatok) nem szerepel a statisztikában. Így a kínai internetet például egészen biztosan alulértékelik, és mivel nem pásztázták végig az összes domain összes oldalát, az is valószínű, hogy nem angolul kommunikáló közösségeket is az angol nyelvű oldalakhoz soroltak. Ezzel együtt látványos, hogy milyen sokan kényszerülnek az anyanyelvüktől eltérő nyelveket (praktikusan az angolt) használni az interneten, és ha figyelmebe vesszük, hogy az új generatív MI-modelleket is a nyilvánosan elérhető online tartalmakon képzik, világossá válik, hogy az új technológia csak tovább erősíti az egyenlőtlenséget.

Részletek a Rest of World cikkében »

Közösség & HR

Máris megszűnik a ChatGPT automata modellválasztója az ingyenes felhasználásban

Nemcsak drága, hanem az OpenAi szerint nem is népszerű, így a bonyolultabb kérdésekre adott pontosabb válaszokhoz ismét manuális modellválasztásra lesz szükség.
 
Hirdetés

Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai

Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.

Sok szervezet adatvezéreltnek tartja magát, mert van BI rendszere és heti dashboardja. A valóságban azonban ennél többről van szó; a kérdés ugyanis nem az, hogy van-e elég adat, hanem, hogy mennyire jól használják a döntések meghozatalához.

a melléklet támogatója a One Solutions

EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!

Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.

2026.03.10. UP Rendezvénytér

RÉSZLETEK »

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.