Történészek és nyelvtörténészek óriási segítséget kaphatnak, ha valóban azt tudja a MIT Számítástechnikai és Mesterséges Intelligencia Laboratóriumának (CSAIL – Computer Science and Artificial Intelligence Laboratory) új fejlesztése, amit kutatói állítanak. Kifejlesztettek egy olyan rendszert, amely vissza tudja fejteni az elveszett nyelveket anélkül, hogy bármit kellene tudni más nyelvekhez való viszonyáról.
Korábban a nyelvészek általában akkor jártak sikerrel egy-egy elveszett nyelv megfejtésénél, ha találtak olyan írásos nyelvi emléket, mely ugyanazt a szöveget több nyelven is tartalmazta. Így sikerült megfejteni például a sumér ékírást (egy Perszepoliszban talált háromnyelvű – óperzsa, elámi és akkád – felirat segítségével), és az egyiptomi hieroglifákhoz is egy ilyen szövegen (az ún. Rosette-i kő hieroglif-démotikus-ógörög feliratán) keresztül vezetett az út. Szintén nagy segítség volt az elveszett nyelvek visszafejtésében a nyelvtörténet módszertana (például az egyiptomiak ősi nyelvének megfejtésében a kopt nyelv is segített). De mindegyik esetben kellett "referencianyelv".
Ha azonban nem volt sem történetileg, sem többnyelvű felirat révén ilyen kiindulópont, a tudósok nem tudtak közel jutni ezeknek a szövegekhez, illetve a nyelvi rendszer feltárásához.
Önmagában vizsgálja a nyelv rendszerét
A MIT kutatóinak rendszerének pusztán olyan szövegekre van szüksége, melyek pár ezer szót tartalmaznak. És azt képes referencianyelv nélkül is elemezni: azonosítja a szavak jelentését és a nyelvtani rendszert (mondattant, ragozási rendszert stb.) is.
A CSAIL-ben folyó kutatás (amit egyébként az Intelligence Advanced Research Projects Activity program, azaz lényegében az USA hírszerzése támogat) azonban nem teljesen független a nyelvészet korábbi eredményeitől – írja a VetureBeat. A kutatócsapat ugyanis olyan algoritmust hozott létre, amely épít a nyelvi transzformációkkal kapcsolatos eddigi ismeretekre. Nagyban támaszkodik a nyelvtörténet által kidolgozott módszerekre és nyelvtörténeti törvényekre, például a hangrendszerben bekövetkező tendencia jellegű változásokra is. Ám képes releváns eredményt adni korlátozott mennyiségű mintából is (az elveszett nyelvek egyik nagy problémája, hogy kevés nyomuk maradt fenn).
Csakhogy az algoritmus fordított nyelvtörténeti kutatást végez. Hagyományosan a nyelvtörténészek két, közvetett bizonyítékok alapján rokonított nyelvet vizsgálva fejtik vissza a nyelvi változásokban bekövetkezett törvényszerűségeket. Az algoritmus ezzel szemben a nyelvet önmagában vizsgálva találja meg azoknak a nyelveknek a körét, amelyekben az adott elveszett nyelv továbbélhet. Meg tudja határozni, hogy az adott ismeretlen nyelv milyen nyelvcsaládba tartozik, és felméri más nyelvektől való (történeti) távolságát is.
A MIT rendszere nem csak megfejtést ad, hanem a kiejtést is megpróbálja reprodukálni. Az egyes hangokat (fonémákat) egy többdimenziós térben helyezi el, ahol a hangok egymáshoz való viszonyát vektorok ábrázolják, azok írják le a kiejtésbeli különbségeket. Emellett képes szegmentálni az egyes szavakat.
A baszkról bebizonyította, amit eddig is tudtunk
Ellenőrzésképpen egy viszonylag jól kutatott nyelvcsoportot, a többségében a nyugati újlatin nyelvek közé sorolt ibériai nyelvet vizsgálták. Az algoritmus külső segédlet nélkül megállapította, hogy bár a baszk közelebb áll az ibériai nyelvekhez, mint más nyelvcsaládokhoz, de nincsenek egymással rokonságban.
A továbblépésre is vannak tervek. A kutatócsapat arra keresi a választ, hogy mit lehet megtudni az elveszett nyelvekről akkor, ha nem maradtak fenn olyan nyelvemlékek, melyekre támaszkodva lehet tanítani az MI algoritmust. Meglehet, ezzel az algoritmussal végre arra is választ kaphatunk, hogy a híres-hírhedt Voynich-kézirat blabla, vagy van benne rendszer.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak