Lehet, hogy ezzel az MI-vel a Voynich-kéziratot is megfejtik?

Bitport2020.10.21.Cloud & big data

A MIT mesterségesintelligencia-laborjában olyan rendszert fejlesztettek, amivel állítólag minden elveszett nyelvet vissza lehet fejteni.

Történészek és nyelvtörténészek óriási segítséget kaphatnak, ha valóban azt tudja a MIT Számítástechnikai és Mesterséges Intelligencia Laboratóriumának (CSAIL – Computer Science and Artificial Intelligence Laboratory) új fejlesztése, amit kutatói állítanak. Kifejlesztettek egy olyan rendszert, amely vissza tudja fejteni az elveszett nyelveket anélkül, hogy bármit kellene tudni más nyelvekhez való viszonyáról.

Korábban a nyelvészek általában akkor jártak sikerrel egy-egy elveszett nyelv megfejtésénél, ha találtak olyan írásos nyelvi emléket, mely ugyanazt a szöveget több nyelven is tartalmazta. Így sikerült megfejteni például a sumér ékírást (egy Perszepoliszban talált háromnyelvű – óperzsa, elámi és akkád – felirat segítségével), és az egyiptomi hieroglifákhoz is egy ilyen szövegen (az ún. Rosette-i kő hieroglif-démotikus-ógörög feliratán) keresztül vezetett az út. Szintén nagy segítség volt az elveszett nyelvek visszafejtésében a nyelvtörténet módszertana (például az egyiptomiak ősi nyelvének megfejtésében a kopt nyelv is segített). De mindegyik esetben kellett "referencianyelv".

Ha azonban nem volt sem történetileg, sem többnyelvű felirat révén ilyen kiindulópont, a tudósok nem tudtak közel jutni ezeknek a szövegekhez, illetve a nyelvi rendszer feltárásához.

Önmagában vizsgálja a nyelv rendszerét

A MIT kutatóinak rendszerének pusztán olyan szövegekre van szüksége, melyek pár ezer szót tartalmaznak. És azt képes referencianyelv nélkül is elemezni: azonosítja a szavak jelentését és a nyelvtani rendszert (mondattant, ragozási rendszert stb.) is.

A CSAIL-ben folyó kutatás (amit egyébként az Intelligence Advanced Research Projects Activity program, azaz lényegében az USA hírszerzése támogat) azonban nem teljesen független a nyelvészet korábbi eredményeitől – írja a VetureBeat. A kutatócsapat ugyanis olyan algoritmust hozott létre, amely épít a nyelvi transzformációkkal kapcsolatos eddigi ismeretekre. Nagyban támaszkodik a nyelvtörténet által kidolgozott módszerekre és nyelvtörténeti törvényekre, például a hangrendszerben bekövetkező tendencia jellegű változásokra is. Ám képes releváns eredményt adni korlátozott mennyiségű mintából is (az elveszett nyelvek egyik nagy problémája, hogy kevés nyomuk maradt fenn).

Csakhogy az algoritmus fordított nyelvtörténeti kutatást végez. Hagyományosan a nyelvtörténészek két, közvetett bizonyítékok alapján rokonított nyelvet vizsgálva fejtik vissza a nyelvi változásokban bekövetkezett törvényszerűségeket. Az algoritmus ezzel szemben a nyelvet önmagában vizsgálva találja meg azoknak a nyelveknek a körét, amelyekben az adott elveszett nyelv továbbélhet. Meg tudja határozni, hogy az adott ismeretlen nyelv milyen nyelvcsaládba tartozik, és felméri más nyelvektől való (történeti) távolságát is.

A MIT rendszere nem csak megfejtést ad, hanem a kiejtést is megpróbálja reprodukálni. Az egyes hangokat (fonémákat) egy többdimenziós térben helyezi el, ahol a hangok egymáshoz való viszonyát vektorok ábrázolják, azok írják le a kiejtésbeli különbségeket. Emellett képes szegmentálni az egyes szavakat.

A baszkról bebizonyította, amit eddig is tudtunk

Ellenőrzésképpen egy viszonylag jól kutatott nyelvcsoportot, a többségében a nyugati újlatin nyelvek közé sorolt ibériai nyelvet vizsgálták. Az algoritmus külső segédlet nélkül megállapította, hogy bár a baszk közelebb áll az ibériai nyelvekhez, mint más nyelvcsaládokhoz, de nincsenek egymással rokonságban.

A továbblépésre is vannak tervek. A kutatócsapat arra keresi a választ, hogy mit lehet megtudni az elveszett nyelvekről akkor, ha nem maradtak fenn olyan nyelvemlékek, melyekre támaszkodva lehet tanítani az MI algoritmust. Meglehet, ezzel az algoritmussal végre arra is választ kaphatunk, hogy a híres-hírhedt Voynich-kézirat blabla, vagy van benne rendszer.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Jobb lesz attól a Claude, hogy kódjának 80 százalékát a Claude írja?

Igen, jobb lesz, hatékonyabb lesz – ám ez nem lesz ingyen. Az IT-irányítás, a biztonság, a megfelelés és a csapatkohézió is megszenvedheti.

Hirdetés

Szintet lép a Synology: Érkezik a PAS7700 csúcskategóriás vállalati flash tároló

Ahogy a vállalati IT-környezetek az AI-alapú folyamatok, a virtualizáció, a nagy teljesítményű adatbázisok és a folyamatosan elérhető digitális szolgáltatások nyomása alatt fejlődnek, a szervezetek egyre inkább olyan tárolóinfrastruktúrát igényelnek, amely kompromisszumok nélküli teljesítményt, rugalmasságot és skálázhatóságot biztosít.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Jobb lesz attól a Claude, hogy kódjának 80 százalékát a Claude írja?

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!