Még mindig rossz ötlet pénzügyi tanácsokat kérni a chatbotoktól

Bitport2025.04.28.Konzumer tech

Kevesen rendelkeznek a megalapozott pénzügyi döntésekhez szükséges képzettséggel, és a szakértő tanácsadók megbízását sem sokan engedhetik meg maguknak, de a mesterséges intelligenciát akkor is jobb kihagyni az ilyen dolgokból.

Amíg a pénzügyi tanácsadók képzésen és szakmai tapasztalaton keresztül szerzik meg a szakértelmüket, addig a nagy nyelvi modellek (LLM-ek) a hatalmas adathalmazokban található nyelvi minták alapján generálják a kimeneteiket. Ezeken a modellek utólagos hangolásával lehet ugyan finomítani, de előre senki sem láthatja az összes feltehető kérdést és mindazokat az árnyalatokat, amelyekre szükség lenne a megbízható válaszokhoz – olvasható a Mind Matters oldalán közzétett tanulmányban.

Az LLM-ek alapvető korlátaik (lényegében a megértés teljes hiánya) ellenére is képesek "az emberi intelligencia megnyugtató illúzióját" kelteni, kiegészítve kár a könnyed társalgási stílusokkal, de a látszat ellenére semminek sem a szakértői. Az emberekre leselkedő valódi veszély tehát nem az, hogy a mesterséges intelligencia esetleg okosabb lesz náluk, hanem ha azt hiszik, hogy a számítógépek értelmesebbek, és emiatt olyan döntések során is megbíznak bennük, amelyek esetében ez egyáltalán nem indokolt.

A cikkben ismertetett kutatás során 12 pénzügyi problémára kértek megoldást a vezető nagy nyelvi modellektől, vagyis az OpenAI ChatGPT-4o-tól, a DeepSeek-V2-től, az Elon Musk-féle Grok 3 Beta kiadásától és a Google Gemini 2-től. A chatbotok ennek alapján "következetesen bőbeszédűnek" bizonyultak, de gyakran tévedtek, ami megfelel egy tavalyi teszt eredményének, ahol az LLM-ek hasonló kérdésekre "nyelvtanilag helyes és látszólag mérvadó, de számtani és kritikai gondolkodási hibákkal teli" válaszokat adtak.

Valójában semmi okunk sincs hinni nekik

Sok fejlődést tehát nem tapasztaltak: mint kiderült, az MI-chatbotok nem voltak képesek racionális elemzéseket készíteni a kutatók által feltett, alapvető pénzügyi kérdésekre. Néhány válasz ráadásul annyira rossznak bizonyult, hogy az a kutatást végző tudósok elvárásait is messze alulmúlta. Amikor például Grokot arra utasították, hogy számolja össze egy karibi bérlemény havi rezsijét, amelynek bérleti díja 3700 dollár, a közüzemi díja pedig havi 200 dollár, a chatbot ragaszkodott hozzá, hogy ez összesen 4900 dolláros kiadást jelent.

A problémához tartozik, hogy a robotok legmeggyőzőbb válaszaikat is különféle online forrásokból gyűjtötték, de ez is csak az egyszerűbb fogalmak magyarázatánál működött, és mindvégig veszélyesen felszínes kimeneteket generáltak. Az már korábban kiderült, hogy amikor a felhasználók kevésbé bíznak az MI-ben, akkor kritikusabban gondolkoznak, és elhiszik, hogy képesek értékelni és javítani a kimeneteket – amire nagy szükség lenne a nemkívánatos következmények, például az ostoba pénzügyi tanácsok terén is.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Konzumer tech

Sajnos egyes rendőrök is rákaptak a generatív algoritmusokra

A legutóbbi ügy Nagy-Britanniában bukott ki, ahol a feltételezések szerint egy rendőr mesterséges intelligencia segítségével gyártott hamis bizonyítékokat.

A hónap témája

Hogyan vezessük be az MI-t szolgáltatásként?

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Sajnos egyes rendőrök is rákaptak a generatív algoritmusokra

Hogyan vezessük be az MI-t szolgáltatásként?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!