Nem sokat javítanak az internetes önorvosláson a generatív algoritmusok

Bitport2026.04.16.Piaci hírek

Egy kutatásban vezető MI-modelleket teszteltek diagnosztaként. Mint kiderült, a végső diagnózis kapcsán elég pontosak, ám a sokkal fontosabb korai szakaszban csúnyán elbuktak.

A sorozatot követők emlékezhetnek rá, hogy a címszereplő Dr. House gyakran mondogatta ironikusan, mennyire kár volt elvégeznie az orvosi egyetemet, amikor a betegei képesek kész diagnózisokkal előállni pár percnyi internetes keresés után. A helyzet a való életben sincs másként: az igazi orvosok sem szokták javasolni az embereknek, hogy a világhálón próbáljanak válaszokat találni egészségügyi problémáikra. Nemrégiben pedig tudományosan igazolták, hogy a helyzeten az sem javít, ha a ChatGPT-t hívjuk segítségül – sőt...

Úgy jó, hogy nem jó

A Harvard és a Massachusetts General Hospital kutatói által jegyzett tanulmány szerint 21 népszerű MI-modellt tettek próbára 29 szabványosított klinikai esetleírás (vignetta) alapján. A végeredmény meglehetősen kettős. Egyfelől az algoritmusok 91 százalékos pontossággal találták el a végleges diagnózist, másrészt átlagosan 80 százalékos hibaaránnyal dolgoztak a korai differenciáldiagnózis során.

Előbbi azt az esetet tükrözi, amikor már minden releváns információ az orvos (vagy jelen esetben chatbot) rendelkezésére áll, így itt sokkal kevesebb a bizonytalanság, illetve kisebb szerep jut a szakértői tapasztalatnak, intuíciónak. Ezzel szemben a folyamat elején pusztán a tünetek alapján kell mérlegelni a különböző eshetőségeket, ami láthatóan nagyon rosszul megy az MI-nek.

Mindez különösen veszélyes lehet a magukat otthon diagnosztizálni próbáló emberekre nézve, hiszen az algoritmusok "természetüknél fogva" képesek a lehető legnagyobb magabiztossággal kijelenteni teljesen légből kapott dolgokat (ez az úgynevezett hallucináció). Így ha chatbotokkal próbáljuk diagnosztizáltatni magunkat, az hamis biztonságérzetet kelthet, vagy éppen indokolatlan szorongást generálhat.

Az LLM-ek védelmében azért érdemes kitérni arra is, hogy az említett 80 százalékos hibaráta egy nagyon szigorú mérce szerint értendő. A modellek sok esetben ugyanis legalább részben eltalálták a tünetek mögött húzódó lehetséges egészségügyi okokat.

Ettől függetlenül a kutatócsoport egyik tagja a The Registernek kihangsúlyozta, mennyire fontos, hogy megértsük a technológia korlátait, és például ne első szűröként funkcionáló chatbotokkal próbáljuk a szakembergárda terhelését csökkenteni. Ha a modell már az elején rossz irányba indul el a differenciáldiagnózis során, az felesleges vizsgálatokhoz, költséges beavatkozásokhoz vagy – ami a legrosszabb – a megfelelő kezelés késlekedéséhez vezethet.

Már diagnosztizált probléma

A kutatási eredmények alátámasztják a korábbi években végzett hasonló vizsgálatok következtetéseit, amelyek rendre arra jutottak, hogy a különböző algoritmusok és gépi tanuló rendszerek egészségügyi alkalmazása a megfelelő szabályozás hiányában sokkal kockázatosabb, mint azt elsőre gondolhatnánk.

Például bő egy évvel ezelőtt számoltunk be arról a projektről, amelyben általános célú LLM-ek képességeit értékelték célzott klinikai feladatokon, és összességében mindegyik program borzalmas hallucinációs rátával dolgozott. Néhány hónap később pedig kiderült, hogy egy-egy elgépelés, szövegformázási hiba, szleng, sőt akár a színes vagy érzelmes nyelvezet is elég hozzá, hogy megzavarja az orvosi tanácsokat adó mesterséges intelligenciát.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Piaci hírek

Az Európai Bizottság szerint nincs több kifogás, elkészült az uniós életkor-ellenőrző alkalmazás

A technológiának központi szerepet szánnak a gyerekek online védelmében, használatát vállalható kellemetlenségnek tartják a közösségi platformok káros hatásaihoz viszonyítva.

A hónap témája

DevSecOps: technológián innen és túl

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Az Európai Bizottság szerint nincs több kifogás, elkészült az uniós életkor-ellenőrző alkalmazás

DevSecOps: technológián innen és túl

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!