Amíg a pénzügyi tanácsadók képzésen és szakmai tapasztalaton keresztül szerzik meg a szakértelmüket, addig a nagy nyelvi modellek (LLM-ek) a hatalmas adathalmazokban található nyelvi minták alapján generálják a kimeneteiket. Ezeken a modellek utólagos hangolásával lehet ugyan finomítani, de előre senki sem láthatja az összes feltehető kérdést és mindazokat az árnyalatokat, amelyekre szükség lenne a megbízható válaszokhoz – olvasható a Mind Matters oldalán közzétett tanulmányban.
Az LLM-ek alapvető korlátaik (lényegében a megértés teljes hiánya) ellenére is képesek "az emberi intelligencia megnyugtató illúzióját" kelteni, kiegészítve kár a könnyed társalgási stílusokkal, de a látszat ellenére semminek sem a szakértői. Az emberekre leselkedő valódi veszély tehát nem az, hogy a mesterséges intelligencia esetleg okosabb lesz náluk, hanem ha azt hiszik, hogy a számítógépek értelmesebbek, és emiatt olyan döntések során is megbíznak bennük, amelyek esetében ez egyáltalán nem indokolt.
A cikkben ismertetett kutatás során 12 pénzügyi problémára kértek megoldást a vezető nagy nyelvi modellektől, vagyis az OpenAI ChatGPT-4o-tól, a DeepSeek-V2-től, az Elon Musk-féle Grok 3 Beta kiadásától és a Google Gemini 2-től. A chatbotok ennek alapján "következetesen bőbeszédűnek" bizonyultak, de gyakran tévedtek, ami megfelel egy tavalyi teszt eredményének, ahol az LLM-ek hasonló kérdésekre "nyelvtanilag helyes és látszólag mérvadó, de számtani és kritikai gondolkodási hibákkal teli" válaszokat adtak.
Valójában semmi okunk sincs hinni nekik
Sok fejlődést tehát nem tapasztaltak: mint kiderült, az MI-chatbotok nem voltak képesek racionális elemzéseket készíteni a kutatók által feltett, alapvető pénzügyi kérdésekre. Néhány válasz ráadásul annyira rossznak bizonyult, hogy az a kutatást végző tudósok elvárásait is messze alulmúlta. Amikor például Grokot arra utasították, hogy számolja össze egy karibi bérlemény havi rezsijét, amelynek bérleti díja 3700 dollár, a közüzemi díja pedig havi 200 dollár, a chatbot ragaszkodott hozzá, hogy ez összesen 4900 dolláros kiadást jelent.
A problémához tartozik, hogy a robotok legmeggyőzőbb válaszaikat is különféle online forrásokból gyűjtötték, de ez is csak az egyszerűbb fogalmak magyarázatánál működött, és mindvégig veszélyesen felszínes kimeneteket generáltak. Az már korábban kiderült, hogy amikor a felhasználók kevésbé bíznak az MI-ben, akkor kritikusabban gondolkoznak, és elhiszik, hogy képesek értékelni és javítani a kimeneteket – amire nagy szükség lenne a nemkívánatos következmények, például az ostoba pénzügyi tanácsok terén is.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak