Hibába ígéretes a mesterséges intelligencia alkalmazása az orvosi diagnosztikában, ha az orvos nem bízik az algoritmus döntésében. A MIT (Massachusetts Institute of Technology) és a Regensburgi Egyetem egy a Nature-ben közelmúltban megjelent közös tanulmánya szerint az MI-rendszereknek csak akkor van pozitív hatása a klinikai gyakorlatban, ha az azokat használó orvosok megtalálják az egyensúlyt a technológiába vetett bizalom és a kétely között. Ha nem bíznak az MI-ben, akkor elutasítanak egy hatékony segítséget, ha vakon bíznak benne, az súlyos hibákhoz vezethet. Ha azonban megvan az optimális arány, akkor az MI és az ember jól kiegészíthetik egymást.
Az orvos joggal él fenntartásokkal. A neves magyar kutató, Lévay György, aki a végtagprotézisek agyi irányításának lehetőségét kutatja, 2019-ben egy vitában így fogalmazott: "Sokkal előbb hagyom jó szívvel, hogy autók vezessék saját magukat, mint azt, hogy az orvosi képdiagnosztikában sztenderdizáljuk a mesterséges intelligencia használatát." Az MI olyan mintahalmazoknál – és kísérleti körülmények között – mutat fel statisztikailag jó eredményeket, ahol jól ismertek a kimenetek, azaz jól ellenőrizhető az MI döntésének helyessége. Amikor mindezt megpróbálják átültetni a gyakorlatba, a hatékonyság csökken. Lévay ezt arra vezette vissza, hogy az emberi aggyal ellentétben az MI zajszűrési képessége még a képdiagnosztika területén is korlátozott. Ha fals pozitív riasztást ad, azt az orvos később kiszűrheti. Ha azonban az eredmény fals negatív, akkor az orvos esetleg egy fontos kórtünetet hagy figyelmen kívül (már ha bízik az MI-ben).
Az MI-vel támogatott diagnosztika szociálpszichológiája
Az MIT és a Regensburgi Egyetem kutatói lényegében egyfajta szociálpszichológiai kísérletet végeztek el, hogy megmérjék: milyen módon veszik figyelembe az orvosok diagnózisuk felállításánál az MI és a humán szakértő tanácsait. A kísérletbe közel 270 önkéntes orvost vontak be, mindegyiküknek nyolc mellkasi röntgenfelvételt kellett elemezni.
A résztvevőket két csoportra osztották. Az első csoportban közel 140 radiológus volt, akiknek napi gyakorlat az ilyen felvételek kiértékelése, így hatalmas tapasztalattal is rendelkeznek benne. A másik csoportot kb. 130 belgyógyász és sürgősségi szakorvos alkotta. Ők is találkoznak röntgenfelvételekkel, de nem az a fő szakterületük, így rendszerint csak kontrollálják a szakorvos megállapításait, illetve a fontosabb tüneteket ismerik fel, melyek alapján el tudják dönteni, hogy szükség van-e specialista bevonására.
A felvételek mellé kaptak nevesítve az MI-től és a humán szakértőtől pontos és pontatlan javaslatokat is. A kísérleti alanyoknak pontozással kellett értékelniük a tanácsokat, majd fel kellett állítaniuk a saját diagnózisukat.
Az eredmények alapvetően nem is olyan meglepőek: a radiológusok rosszabbnak, az egyéb szakorvosok nagyjából ugyanolyan minőségűnek értékelték az MI és a szakértő tanácsait. Amikor az MI és a szakértő helyes információkkal segítette az orvosokat, szakterülettől függetlenül megugrott a jó diagnózisok aránya: a radiológusok 40 százalékkal, az egyéb szakorvosok 38 százalékkal teljesítettek jobban. A tanács forrása (szakértő vagy MI) lényegében nem befolyásolta a teljesítményt.
A hibás javaslatoknál, érkezzen az az MI-től vagy a szakértőtől, kiütköztek a szakterületi különbségek. A radiológusoknak csupán 28 százaléka volt fogékony a hibás információkra, míg a másik csoportban 42 százalék volt ez az arány. Az összes téves tanácsot a radiológusok 28 százaléka, a másik csoport 17 százaléka azonosította és cáfolta.
Az emberi tényezőt is figyelembe kell venni
A felmérés újabb aspektusát adja annak a problémának, amit fentebb Lévay Györgytől is idéztünk, tudniillik hogy az MI rosszabbul teljesít terepen, mint a laborban. A mostani kísérlet arra hívja fel a figyelmet, hogy ez nem csak az adatokon múlik. Az orvosi MI-algoritmusok fejlesztésénél figyelembe kell venni egy fontos "szociológiai" változót: jelesül azt, hogy az orvosok hogyan viszonyulnak az MI-hez, és hogyan használják a lehetőségeit. Magas kockázatú környezetben – ilyen az orvosi diagnosztika is, hiszen gyakran emberélet múlik rajta –, a javaslatokra való túlzott támaszkodás veszélyes, különösen ha a javaslat hibás vagy pontatlan.
Az orvosok általában az első vizsgálatok elvégzése után kérnek külső tanácsot (pl. mert nem tudnak dönteni). Ilyenkor azonban hajlamosak a gyanújukat megerősítő információk felértékelésére. Ha egy orvos a kollégájától kér tanácsot, akkor kialakulhat egy szakmai párbeszéd, ami közelebb vihet a helyes megoldáshoz. Ezzel szemben az MI-nél ez az interakció hiányzik, így kisebb az esélye annak is, hogy az általa adott tanács az orvost eredeti véleménye felülvizsgálatára sarkallja. Ezt a tényezőt figyelembe kell vennie az orvosi diagnosztikát segítő algoritmusok fejlesztésénél, hogy csökkentsük az alkalmazásával járó kockázatokat.
A kutatók tanulmánya itt érhető el.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak