A MIT mesterségesintelligencia-laborjában olyan rendszert fejlesztettek, amivel állítólag minden elveszett nyelvet vissza lehet fejteni.

Történészek és nyelvtörténészek óriási segítséget kaphatnak, ha valóban azt tudja a MIT Számítástechnikai és Mesterséges Intelligencia Laboratóriumának (CSAIL – Computer Science and Artificial Intelligence Laboratory) új fejlesztése, amit kutatói állítanak. Kifejlesztettek egy olyan rendszert, amely vissza tudja fejteni az elveszett nyelveket anélkül, hogy bármit kellene tudni más nyelvekhez való viszonyáról.

Korábban a nyelvészek általában akkor jártak sikerrel egy-egy elveszett nyelv megfejtésénél, ha találtak olyan írásos nyelvi emléket, mely ugyanazt a szöveget több nyelven is tartalmazta. Így sikerült megfejteni például a sumér ékírást (egy Perszepoliszban talált háromnyelvű – óperzsa, elámi és akkád – felirat segítségével), és az egyiptomi hieroglifákhoz is egy ilyen szövegen (az ún. Rosette-i kő hieroglif-démotikus-ógörög feliratán) keresztül vezetett az út. Szintén nagy segítség volt az elveszett nyelvek visszafejtésében a nyelvtörténet módszertana (például az egyiptomiak ősi nyelvének megfejtésében a kopt nyelv is segített). De mindegyik esetben kellett "referencianyelv".

Ha azonban nem volt sem történetileg, sem többnyelvű felirat révén ilyen kiindulópont, a tudósok nem tudtak közel jutni ezeknek a szövegekhez, illetve a nyelvi rendszer feltárásához.

Önmagában vizsgálja a nyelv rendszerét

A MIT kutatóinak rendszerének pusztán olyan szövegekre van szüksége, melyek pár ezer szót tartalmaznak. És azt képes referencianyelv nélkül is elemezni: azonosítja a szavak jelentését és a nyelvtani rendszert (mondattant, ragozási rendszert stb.) is.

A CSAIL-ben folyó kutatás (amit egyébként az Intelligence Advanced Research Projects Activity program, azaz lényegében az USA hírszerzése támogat) azonban nem teljesen független a nyelvészet korábbi eredményeitől – írja a VetureBeat. A kutatócsapat ugyanis olyan algoritmust hozott létre, amely épít a nyelvi transzformációkkal kapcsolatos eddigi ismeretekre. Nagyban támaszkodik a nyelvtörténet által kidolgozott módszerekre és nyelvtörténeti törvényekre, például a hangrendszerben bekövetkező tendencia jellegű változásokra is. Ám képes releváns eredményt adni korlátozott mennyiségű mintából is (az elveszett nyelvek egyik nagy problémája, hogy kevés nyomuk maradt fenn).

Csakhogy az algoritmus fordított nyelvtörténeti kutatást végez. Hagyományosan a nyelvtörténészek két, közvetett bizonyítékok alapján rokonított nyelvet vizsgálva fejtik vissza a nyelvi változásokban bekövetkezett törvényszerűségeket. Az algoritmus ezzel szemben a nyelvet önmagában vizsgálva találja meg azoknak a nyelveknek a körét, amelyekben az adott elveszett nyelv továbbélhet. Meg tudja határozni, hogy az adott ismeretlen nyelv milyen nyelvcsaládba tartozik, és felméri más nyelvektől való (történeti) távolságát is.

A MIT rendszere nem csak megfejtést ad, hanem a kiejtést is megpróbálja reprodukálni. Az egyes hangokat (fonémákat) egy többdimenziós térben helyezi el, ahol a hangok egymáshoz való viszonyát vektorok ábrázolják, azok írják le a kiejtésbeli különbségeket. Emellett képes szegmentálni az egyes szavakat.

A baszkról bebizonyította, amit eddig is tudtunk

Ellenőrzésképpen egy viszonylag jól kutatott nyelvcsoportot, a többségében a nyugati újlatin nyelvek közé sorolt ibériai nyelvet vizsgálták. Az algoritmus külső segédlet nélkül megállapította, hogy bár a baszk közelebb áll az ibériai nyelvekhez, mint más nyelvcsaládokhoz, de nincsenek egymással rokonságban.

A továbblépésre is vannak tervek. A kutatócsapat arra keresi a választ, hogy mit lehet megtudni az elveszett nyelvekről akkor, ha nem maradtak fenn olyan nyelvemlékek, melyekre támaszkodva lehet tanítani az MI algoritmust. Meglehet, ezzel az algoritmussal végre arra is választ kaphatunk, hogy a híres-hírhedt Voynich-kézirat blabla, vagy van benne rendszer.

Hirdetés
Cloud & big data

Musk turbó fokozatban nyomta le Gatest

A többek között a Tesla alapításával hírnevett szerzett Elon Musk immár a világ második leggazdagabb embere.
 
Hirdetés
Hirdetés

A profik már nindzsákkal védik a szervereket

Hogyan igazodjunk el, és főleg mire figyeljünk a szolgáltatásként rendelhető virtuális szerverek között?

A cloud szolgáltatások legösszetettebb problémáit a kifejezetten a felhőre jellemző fenyegetettségek jelentik, amelyekkel már a szolgáltatóválasztás előtt érdemes tisztába jönni.

a melléklet támogatója a Servergarden

Nem általában a távmunkáé, hanem a mostani tipikus távmunka-helyzeteké. A szervezetek arra nem voltak felkészülve, hogy mindenki otthonról dolgozik.

Alapjaiban kell megújítani a biztonságról kialakított felfogásunkat

Tavaly január végétől megszűnt a Java SE 8 ingyenes frissítése, és a Java SE 11 sem használható ingyenesen üzleti célra. Tanácsok azoknak, akik még nem találtak megoldást. Hegedüs Tamás (IPR-Insights) írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizenegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2020 Bitport.hu Média Kft. Minden jog fenntartva.