Az MI már szövegértésben is jobb az embereknél

Tököli Gábor2018.01.18.Cloud & big data

Még ha nem is sokkal. Az Alibaba és a Microsoft MI-modelljével újabb mérföldkőhöz érkezett a mesterséges intelligencia fejlődése.

Januárban az Alibaba és a Microsoft is a Stanford egyetem által készített tesztnek vetette alá saját fejlesztésű MI-modelljét, amelynek célja a rendszerek természetes nyelvek feldolgozására vonatkozó képességeinek mérése volt. A Stanford Question Answering Dataset (SQuAD) egy speciálisan erre a célra összeállított adatkészlet, amelynek alapján a gépeknek összesen 500 Wikipedia-cikkre vonatkozóan több mint 100 ezer kérdésre kell minél alaposabb választ adniuk.

A teszt meghatározza az Exact Match (a pontos válaszok) értékelésére szolgáló viszonyszám értékét az átlagos emberi felhasználók esetében, vagyis az MI-knek ezt kell megközelíteniük vagy akár meghaladniuk, hogy a humán képességekkel összevethető szövegértési kompetenciáról beszéljünk. Ez egészen idáig nem jött össze nekik, azonban az Alibaba és a Microsoft rendszere most első ízben megugrotta az emberi adottságokra reflektáló 82,304 pontot.

Ez a belépő a gyakorlati felhasználásba

Az Alibaba mesterséges intelligenciája egészen pontosan 82,44, míg a Microsoft rendszere 82,65 EM-pontot ért el. Ezzel mindkettő sikeresen vette az akadályt, bár az Alibaba most azzal haknizik, hogy a világon elsőként az ő MI-je volt képes meghaladni az emberi teljesítményt – ez annyiban igaz is, hogy az Alibaba végső pontszámát egy nappal korábban véglegesítették a Microsofthoz képest, de a gyakorlatban ez egy megosztott első helyet jelent.

A teszt jelentősége abban áll, hogy az MI-k ezzel már nagy pontossággal képesek értelmezni az egzakt módon, de számtalan lehetséges megfogalmazásban feltett kérdéseket. (Arról, hogy ez technikai szempontból mennyire bonyolult dolog, legutóbb a gyerekek által használt hang alapú vezérlés kapcsán írtunk.)

Az Alibaba természetes nyelvek feldolgozásával foglalkozó vezető kutatója szerint a mostani eredmény nyomán már elmondhatjuk, hogy az olyan kérdésekre, mint mondjuk a "mitől esik az eső", a gépek ma már nagyon nagy pontossággal képesek válaszolni. A technológia ezután lépésről lépésre alkalmazható lesz egy nagy csomó felhasználási területen, mint amilyen az ügyfélszolgálati tevékenység, a múzeumi vezetés vagy az orvosi tanácsadás – a lényeg nyilván az, hogy a folyamatokban minden esetben drámaian csökken az emberi támogatás szükségszerűsége.

Megállíthatatlanul fejlődnek, de van is hova

Teljes sci-fi-őrületre azért még ne számítsunk, hiszen a technológiák gyakorlati implementációja csak hosszabb távon valósul meg. Ráadásul más – ugyancsak kínai – kutatások arra figyelmeztetnek, hogy az MI-rendszerek félelmetes adatfeldolgozó képességük és tanulási sebességük ellenére sem okosabbak egy 6 éves gyereknél. Bár léteznek olyan modellek, amelyek nulláról indulva és saját magukat tanítva, néhány óra alatt képesek lesznek elverni a legjobb emberi sakk- vagy gójátékosokat, ezek is a meghatározott gondolkodási sémák szerint működnek.

A kínai fejlesztésű AI-MATHS vagy a japán Torobo robotok például azért hasaltak el tavaly a helyi gimnáziumi matematika felvételiken, mert esetenként nem tudták értelmezni a szöveges feladatokat, amelyeket amúgy lazán képesek lettek volna megoldani. Ez nem jelenti, hogy a későbbiekben sem sikerül majd a dolog, hiszen a rendszerek gyors ütemben tanulnak és fejlődnek. A természetes nyelvek feldolgozása viszont olyan terület, ahol a gépek és az emberek teljesítménye között a látványos eredmények ellenére is még nagyon nagy a különbség.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Sikeres volt a számítógéppel irányított kiborgcsótányok bevetése

Az új megközelítés megoldaná a több robotból álló rendszerek navigálásának olyan problémáit, mint amilyen a robotok ütközése, az ismeretlen környezethez való alkalmazkodás vagy az energiahatékonyság.

Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A hónap témája

A jó adatmentés ismérvei

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Podcast

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

CIO Podcast #58: Valóban mindenre (is) jó az MI?

MÉG TÖBB CIO PODCAST »

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Sikeres volt a számítógéppel irányított kiborgcsótányok bevetése

A jó adatmentés ismérvei

Régen minden jobb volt? A VMware licencelési változásai

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2024 konferencia