Amíg a pénzügyi tanácsadók képzésen és szakmai tapasztalaton keresztül szerzik meg a szakértelmüket, addig a nagy nyelvi modellek (LLM-ek) a hatalmas adathalmazokban található nyelvi minták alapján generálják a kimeneteiket. Ezeken a modellek utólagos hangolásával lehet ugyan finomítani, de előre senki sem láthatja az összes feltehető kérdést és mindazokat az árnyalatokat, amelyekre szükség lenne a megbízható válaszokhoz – olvasható a Mind Matters oldalán közzétett tanulmányban.
Az LLM-ek alapvető korlátaik (lényegében a megértés teljes hiánya) ellenére is képesek "az emberi intelligencia megnyugtató illúzióját" kelteni, kiegészítve kár a könnyed társalgási stílusokkal, de a látszat ellenére semminek sem a szakértői. Az emberekre leselkedő valódi veszély tehát nem az, hogy a mesterséges intelligencia esetleg okosabb lesz náluk, hanem ha azt hiszik, hogy a számítógépek értelmesebbek, és emiatt olyan döntések során is megbíznak bennük, amelyek esetében ez egyáltalán nem indokolt.
A cikkben ismertetett kutatás során 12 pénzügyi problémára kértek megoldást a vezető nagy nyelvi modellektől, vagyis az OpenAI ChatGPT-4o-tól, a DeepSeek-V2-től, az Elon Musk-féle Grok 3 Beta kiadásától és a Google Gemini 2-től. A chatbotok ennek alapján "következetesen bőbeszédűnek" bizonyultak, de gyakran tévedtek, ami megfelel egy tavalyi teszt eredményének, ahol az LLM-ek hasonló kérdésekre "nyelvtanilag helyes és látszólag mérvadó, de számtani és kritikai gondolkodási hibákkal teli" válaszokat adtak.
Valójában semmi okunk sincs hinni nekik
Sok fejlődést tehát nem tapasztaltak: mint kiderült, az MI-chatbotok nem voltak képesek racionális elemzéseket készíteni a kutatók által feltett, alapvető pénzügyi kérdésekre. Néhány válasz ráadásul annyira rossznak bizonyult, hogy az a kutatást végző tudósok elvárásait is messze alulmúlta. Amikor például Grokot arra utasították, hogy számolja össze egy karibi bérlemény havi rezsijét, amelynek bérleti díja 3700 dollár, a közüzemi díja pedig havi 200 dollár, a chatbot ragaszkodott hozzá, hogy ez összesen 4900 dolláros kiadást jelent.
A problémához tartozik, hogy a robotok legmeggyőzőbb válaszaikat is különféle online forrásokból gyűjtötték, de ez is csak az egyszerűbb fogalmak magyarázatánál működött, és mindvégig veszélyesen felszínes kimeneteket generáltak. Az már korábban kiderült, hogy amikor a felhasználók kevésbé bíznak az MI-ben, akkor kritikusabban gondolkoznak, és elhiszik, hogy képesek értékelni és javítani a kimeneteket – amire nagy szükség lenne a nemkívánatos következmények, például az ostoba pénzügyi tanácsok terén is.
Digitalizáció a mindennapokban: hogyan lesz a stratégiai célból napi működés?
A digitális transzformáció sok vállalatnál már nem cél, hanem elvárás – mégis gyakran megreked a tervezőasztalon. A vezetői szinten megfogalmazott ambiciózus tervek nehezen fordulnak át napi működéssé, ha hiányzik a technológiai rugalmasság vagy a belső kohézió.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak