Téved és hazudozik a kórházakban is egyre többet használt MI-eszköz

Bitport2024.11.02.Piaci hírek

Az OpenAI technológiájával hajtott Nablánál emberi szintű teljesítménnyel hirdetik az orvos-beteg megbeszélésekről átiratokat készítő terméküket, bár azt ők sem gondolhatják, hogy az egészségügyben dolgozó emberek rendszeresen ilyen hibákat követnének el.

Hirdetés

Az Associated Press riportja alapján több tucat szakértő is megerősítette, hogy az OpenAI beszédfelismerő és az elhangzottakat írott tartalommá alakító Whisper modellje nemcsak pontatlanul működik, de gyakran hallucinál, vagyis az eredeti forrástól teljesen független szövegek jelennek meg a kimeneteiben. Ez önmagában már nem is lenne hír, de a cikk szerint minimum aggasztó, hogy kik támaszkodnak egyre nagyobb számban erre a technológiára.

Annak ellenére, hogy maga az OpenAI sem tartja alkalmasnak a Whispert a "nagy kockázatú területeken" való alkalmazásra, és erre figyelmezteti is a felhasználóit, ma már 40 egészségügyi rendszer és több mint 30 ezer egészségügyi dolgozó használ egy erre épített eszközt. A Nabla azonos nevű megoldása a gyártó szerint minden klinikai területen pillanatok alatt képes átiratokat vagy összefoglalókat készíteni a páciensekkel zajló beszélgetésekről. Bár kifejezetten az orvosi nyelvezetre hangolták, az AP összeállításából kiderül, hogy ez kevés a mögöttes technológia eredendő megbízhatatlanságának kiküszöböléséhez.

A hírügynökségnek nyilatkozó mérnökök egyike például azt állítja, hogy az általa vizsgált több mint 100 órányi anyag felében fedezett fel hallucinációkat, miközben egy másik szakember 26 ezer átiratot fésült át, és azok szinte mindegyikében talált hibákat. Érdemes megjegyezni, hogy a Whisper még jól rögzített, rövid hangminták esetében is gyengén teljesített, egy másik kutatásban pedig feltárták, hogy milyen megdöbbentő tévedésekről van szó.

Javításra sem lesz lehetőség

A kirívó példák között említik, amikor az MI előzmény vagy utasítás nélkül faji meghatározásokat gyárt, nem létező gyógyszerekről beszél, vagy olyan erőszakos és szexuális cselekményeket ír le, amelyek egyáltalán nem szerepeltek az eredeti beszélgetésekben. Ehhez képest lényegtelennek tűnik, amikor olyan kifejezésekkel gazdagítja az átiratokat, mint a "lájkold és iratkozz fel". A kutatók összességében a hibák csaknem 40 százalékát minőstették károsnak vagy aggasztónak, mert ezek nyomán könnyen félre lehet értelmezni, hogy valójában mi is hangzott el a megbeszélések során.

Sok fantázia innentől nem kell hozzá, hogy valaki elképzelje a lehetséges károkozás mértékét az egészségügyi területen. A Nabla saját becslése szerint az eszközt már 7 millió orvosi vizit szöveges dokumentálásához használták, így a pontatlanságok és a légből kapott hülyeségek nagyon sok esetben a hivatalos nyilvántartás részévé válhattak. Különösen úgy, hogy utólagos ellenőrzésükre sem feltétlenül lesz mód, mert adatvédelmi megfontolásokra hivatkozva törlik az eredeti hangfelvételeket.

A cikkből kiderül, hogy a Whisper hallucinációival a Nabla illetékesei is tisztában vannak, és az AP szerint foglalkoznak is a problémával. Ez a jelek szerint azonban nem akadályozza meg őket abban, hogy megbízhatatlan kísérleti technológiájukkal az egészségügyi szolgáltatóknál házaljanak. Mivel pedig az orvosok és a betegek találkozói bizalmasak, kívülről azt is nehéz lesz megállapítani, hogy utóbbiak ellátására milyen hatással lesznek majd a mesterséges intelligenciával generált átiratok.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Piaci hírek

Amerikában törvénnyel választanák le a kiskorú felhasználókat az MI-chatbotokról

A kétpárti javaslatot jegyző szenátorok morális kötelességnek és kormányzati érdeknek nevezték, hogy világos szabályokkal vegyék elejét az ellenőrizetlenül működő alkalmazások további károkozásának.

Hirdetés

Az end-to-end védelmeké a jövő

A kódbiztonság integrálásával új fejlődési szakaszukba léptek a felhős védelmi platformok. Werner Obringot, a Clico Hungary cloud security architektjét kérdeztük a miértekről és hogyanokról.

A hónap témája

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

A biztonsági megoldásszállítók érthető módon egy irányba mozdulnak, hiszen ugyanazoknak a támadásoknak az ellenszerét keresik. Megoldási javaslataikban sokszor csak árnyalatnyiak a különbségek, ami egyszerre könnyíti és nehezíti a választást.

a melléklet támogatója a Clico Hungary

CIO Podcast

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Amerikában törvénnyel választanák le a kiskorú felhasználókat az MI-chatbotokról

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia