Amikor 1964-ben a MIT mesterséges intelligencia laborjában Joseph Weizenbaum elkezdte fejleszteni az első beszélgető programját, az ELIZA-t, még nem igazán lehetett látni, mikor és hogyan valósulhat meg a természetes nyelvi feldolgozásra épülő mesterséges intelligencia. (Az ELIZA-ról rengeteg cikk született, ennek a tanulmánynak a végén például még egy ELIZA scriptet is találnak.)
Ma pedig egyre többen állítják, hogy a természetes nyelv már nem csak az embernél, hanem a szoftvereknél is az új általános célú API (Application Programming Interface). Ahogy a szoftverbirodalmak is építik a maguk rendszereit – az Apple a Sirit, a Microsoft a Cortanat, a Google a 2012. óta fejlesztett Now-t, az Amazon az Echo-t, azaz az Alexa-t vagy a Facebook az intelligens Messengert – a startupok is ráálltak erre a vonalra.
A kockázati tőkések is harapnak rá
A CB Insigts (maga is egy ígéretes startup) adatbázisa szerint 2015-ben huszonegy olyan, pályája elején járó startup kapott kisebb-nagyobb befektetéseket, amely valamilyen chatbot megoldáson dolgozik. A június közepén frissített lista szerint a cégek összesen 120 millió dollár befektetést gyűjtöttek.
A legtöbbet, 34,2 millió dollárt egy üzleti felhasználóknak mesterséges intelligenciára épülő ütemezési asszisztenst fejlesztő cég, az x.ai kapta. Az egészségügyi (mobil) alkalmazásokat és digitális egészségügyi platformhoz AI interfészt fejlesztő angol Babylon Health 25 milliót, az étteremkereséshez AI-alapú chatbotot fejlesztő Ozlo pedig 14 milliót kapott. De ezek csak a legnagyobbak.
A huszonegy cég között vannak olyanok, melyek konkrét terméket, szolgáltatást fejlesztenek, de olyanok is, melyek a technológiára koncentrálnak. Ugyanis egy valami közös ezekben a fejlesztésekben: a természetes nyelvi feldolgozás körül forognak.
Nincs rá kézenfekvő megoldás
A Facebook legújabb fejlesztése jól összefoglalja, hogy mi is lenne a chatbotokkal a cél: értelmezni és feldolgozni az írott vagy akusztikus (beszélt) információkat, és adekvát gépi választ adni rá. Tehát mint azt a DeepText kapcsán írtuk, ha valaki a Facebook Messengerben azt írja a haverjának, hogy hamarosan indul moziba, és hamarosan hívja a taxit, ezt az üzenetet az AI legyen képes értelmezni, és például megkérdezni – akár gépi hanggal, akár íritt formában – hogy mikorra kérje az autót a lakáshoz.
Ezért annyira fontos irány a mesterségesintelligencia-kutatásokban a természetes nyelvi feldolgozás. És ezért izgatta a probléma már nagyon korán a mesterségesintelligencia-kutatókat (lásd Turing-teszt).
A Fginancial Times a témának szentelt összeállításban egy könyvelő cég példáján mutatja be, hogy mennyire tágak az AI alkalmazásának a lehetőségei. De az is kiderül belőle, hogy a természetes nyelvi feldolgozás még közel sem áll olyan szinten, mint amit a cégek közleményei – kávzi győzerlmi jelentései – sugallnak. Az brit Sage olyan könyvelő asszisztens tervez, amely elsősorban kisvállalkozásoknak segít a könyvelési problémák megoldásában. Tehát épp annak a rétegnek, amelynek a pénzügyi felkészültsége alacsony szinten van.
A rendszer fejlesztéslét vezető Kriti Sharma az egyik legnagyobb kihívásnak a különböző beszédhelyzetek intelligens kezelését tartja. Mert ebben rossz példa van bőven. Egy közelmúltbeli esettel a Bitport is foglalkozott: a Microsoft Tay rendszerét némi trollkodással sikerült rasszista Hitler-imádóvá alakítani.
Bonyolult az emberi kommunikáció
A Sage intelligens asszisztensének fejlesztői szerint az AI-alapú chatrobotokhoz is kell egyfajta kommunikációs tréner, amely felkészíti a rendszert arra, hogy megfelelően reagáljon minden szituációban. Az ugyanis egy régi alaptétel – erre4 szintén a Microsoft egy nem túl népszerű fejlesztése derített fényt –, hogy a felhasználók idegenkednek az olyan számítógépes segédektől, melyek úton-útfélen megsértik az emberi szokásokat. (A kérdést egyébként a Stanford Egyetemen jól meg is kutatták.)
A Financial Timesnak nyilatkozó Jonathan Mugan, a Deep Grammar cég alapító-vezérigazgatója, szerint a probléma ott van, hogy bár a deep learningre épülő chatbotok sokkal összetettebb "alakfelimserésre" képesek, mint a korai asszisztensek, még mindig nem elég "okosak". Azaz az intelligens chatbot megfelelő mennyiségű adatból megközelítőleg meg tudják határozni, hogy mi egy szó jelentése, de ez még messze van attól, hogy a jelentéseket úgy értelmezze, mint egy ember.
Az emberi nyelv megtanulása bonyolult folyamat. Az anyanyelv magas szintű elsajátítása is éveket vesz igénybe. Egy szó jelentése ugyanis soha nem önmagában áll. Legegyszerűbb esetben is ott az azt befolyásoló szövegkörnyezet, az személyes nyelvhasználatból eredő eltérések, a kulturális jelentésrétegek, a metaforikus használatból eredő módosulások és így tovább.
Mugan szerint, aki kollégáival egy deep learningen alapuló intelligens helyesírás-ellenőrző alkalmazást fejlesztenek (valódi helyesírás-ellenőrzőt, és nem olyan elgépelés-ellenőrzőt, mint amit a Microsoft Office-hoz vagy az OpenOffice-hoz mellékelnek), ez nem lehetetlen. Csakhogy ehhez rengeteg adatra van szükség, és az intelligens chatbotok és az ember hosszú, akár évekig tartó interakciójára is. Mugan szerint egyébként első lépésként az lehet a cél, hogy a természetes nyelvfeldolgozó AI-k nyelvi megértési szintje eljusson egy négyéves gyerek szintjére.
Úgyhogy azzal ne is foglalkozzunk egyelőre, hány ember munkáját válthatják ki néhány éven belül a chatbotok.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak