A MIT mesterségesintelligencia-laborjában olyan rendszert fejlesztettek, amivel állítólag minden elveszett nyelvet vissza lehet fejteni.

Történészek és nyelvtörténészek óriási segítséget kaphatnak, ha valóban azt tudja a MIT Számítástechnikai és Mesterséges Intelligencia Laboratóriumának (CSAIL – Computer Science and Artificial Intelligence Laboratory) új fejlesztése, amit kutatói állítanak. Kifejlesztettek egy olyan rendszert, amely vissza tudja fejteni az elveszett nyelveket anélkül, hogy bármit kellene tudni más nyelvekhez való viszonyáról.

Korábban a nyelvészek általában akkor jártak sikerrel egy-egy elveszett nyelv megfejtésénél, ha találtak olyan írásos nyelvi emléket, mely ugyanazt a szöveget több nyelven is tartalmazta. Így sikerült megfejteni például a sumér ékírást (egy Perszepoliszban talált háromnyelvű – óperzsa, elámi és akkád – felirat segítségével), és az egyiptomi hieroglifákhoz is egy ilyen szövegen (az ún. Rosette-i kő hieroglif-démotikus-ógörög feliratán) keresztül vezetett az út. Szintén nagy segítség volt az elveszett nyelvek visszafejtésében a nyelvtörténet módszertana (például az egyiptomiak ősi nyelvének megfejtésében a kopt nyelv is segített). De mindegyik esetben kellett "referencianyelv".

Ha azonban nem volt sem történetileg, sem többnyelvű felirat révén ilyen kiindulópont, a tudósok nem tudtak közel jutni ezeknek a szövegekhez, illetve a nyelvi rendszer feltárásához.

Önmagában vizsgálja a nyelv rendszerét

A MIT kutatóinak rendszerének pusztán olyan szövegekre van szüksége, melyek pár ezer szót tartalmaznak. És azt képes referencianyelv nélkül is elemezni: azonosítja a szavak jelentését és a nyelvtani rendszert (mondattant, ragozási rendszert stb.) is.

A CSAIL-ben folyó kutatás (amit egyébként az Intelligence Advanced Research Projects Activity program, azaz lényegében az USA hírszerzése támogat) azonban nem teljesen független a nyelvészet korábbi eredményeitől – írja a VetureBeat. A kutatócsapat ugyanis olyan algoritmust hozott létre, amely épít a nyelvi transzformációkkal kapcsolatos eddigi ismeretekre. Nagyban támaszkodik a nyelvtörténet által kidolgozott módszerekre és nyelvtörténeti törvényekre, például a hangrendszerben bekövetkező tendencia jellegű változásokra is. Ám képes releváns eredményt adni korlátozott mennyiségű mintából is (az elveszett nyelvek egyik nagy problémája, hogy kevés nyomuk maradt fenn).

Csakhogy az algoritmus fordított nyelvtörténeti kutatást végez. Hagyományosan a nyelvtörténészek két, közvetett bizonyítékok alapján rokonított nyelvet vizsgálva fejtik vissza a nyelvi változásokban bekövetkezett törvényszerűségeket. Az algoritmus ezzel szemben a nyelvet önmagában vizsgálva találja meg azoknak a nyelveknek a körét, amelyekben az adott elveszett nyelv továbbélhet. Meg tudja határozni, hogy az adott ismeretlen nyelv milyen nyelvcsaládba tartozik, és felméri más nyelvektől való (történeti) távolságát is.

A MIT rendszere nem csak megfejtést ad, hanem a kiejtést is megpróbálja reprodukálni. Az egyes hangokat (fonémákat) egy többdimenziós térben helyezi el, ahol a hangok egymáshoz való viszonyát vektorok ábrázolják, azok írják le a kiejtésbeli különbségeket. Emellett képes szegmentálni az egyes szavakat.

A baszkról bebizonyította, amit eddig is tudtunk

Ellenőrzésképpen egy viszonylag jól kutatott nyelvcsoportot, a többségében a nyugati újlatin nyelvek közé sorolt ibériai nyelvet vizsgálták. Az algoritmus külső segédlet nélkül megállapította, hogy bár a baszk közelebb áll az ibériai nyelvekhez, mint más nyelvcsaládokhoz, de nincsenek egymással rokonságban.

A továbblépésre is vannak tervek. A kutatócsapat arra keresi a választ, hogy mit lehet megtudni az elveszett nyelvekről akkor, ha nem maradtak fenn olyan nyelvemlékek, melyekre támaszkodva lehet tanítani az MI algoritmust. Meglehet, ezzel az algoritmussal végre arra is választ kaphatunk, hogy a híres-hírhedt Voynich-kézirat blabla, vagy van benne rendszer.

Cloud & big data

Visszavonulót fújt Európában a TikTok

Az Európai Bizottságnak nagyon nem tetszett a kínai közösségi alkalmazás ösztönzőporgramja, amit olyan addiktívnak és károsnak jellemeztek, mint a dohányzást.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.