Az egyik ausztrál szabályozó hatóság kísérletéből kiderült, hogy a hosszú dokumentumok tartalmi összefoglalásában az önállóan működő MI nemhogy nem segít, de még külön munkát is ad az embereknek.
Hirdetés
 

A mesterséges intelligencia minden tekintetben gyengébben teljesít a dokumentumok kivonatolásában, mint az emberek, sőt a gyakorlatban még plusz munkát is termelhet nekik – számolt be róla a Crikey online hírügynökség egy kormányzati projektre hivatkozva. Az ausztrál pénzügyi felügyelet az Amazonnal közösen tesztelte a generatív MI-modelleket egy könyvvizsgáló és tanácsadó cégeket érintő parlamenti vizsgálat beadványain, miközben a feladatokat kiadta tíz különböző beosztású alkalmazottjának is. A tesztek végén pedig kiderült, hogy az emberi munkaerő ezen a téren nullra veri a gépi intelligenciát.

A bírálók a terjedelem, a koherencia, a belső és a szabályozási hivatkozások, illetve az ajánlások tekintetében is értékelte az összefoglalókat, miközben nem is voltak vele tisztában, hogy némelyik anyagot egy-egy generatív MI-rendszer gyártotta. Az esetek túlnyomó többségében úgy találták, hogy az emberi összefoglalók minden kritérium és minden beadvány tekintetében felülmúlták az automatizált kimeneteket: a humán munkaerő összességében 81 százalékos eredményt ért el a felállított szempontrendszer alapján, míg a mesterséges intelligencia kimenetei összességében 47 százalékot értek el.

A lenagyobb különbség a tudósítás alapján a hosszú dokumentumok hivatkozásainak azonosításában volt, amivel a jelek szerint nehezen birkóznak meg az MI-modellek, de a bírálók szerint gyakran figyelmen kívül hagyták a hangsúlyokat, az árnyalatokat és a kontextust is. Esetenként helytelen információ jelent meg az anyagokban, vagy hiányzott belőlük valamilyen releváns tartalom, miközben az MI hajlamos volt lényegesnek jelölni az ügy szempontjából lényegtelen részeket. A hibákra egyébként jellemző, hogy az öt értékelő közül állítólag három is megsejtette útközben, hogy MI-vel létrehozott anyagokkal van dolga.

Önálló munkára biztosan nem alkalmasak

A bírálók a cikk szerint kiemelték, hogy ezek az összefoglalók ellentmondásokat tartalmazhatnak, és a gyakorlatban nem tehermentesítik az embereket, mivel a tényeket ellenőrizni kell bennük, és hivatkozni kell az eredeti beadványokra is, amelyek jobban és tömörebben jelenítik meg az üzeneteket. A jelentésben azért az is szerepel, hogy a kísérlet során használt modellek képességei időközben fejlődtek, javítva az összegzés képességét, miután az Amazon az utasítások és bemenetek finomításával növelte a teljesítményüket – vagyis nem zárható ki, hogy a gépek a távolabbi jövőben megfelelően teljesítenek majd.

A tesztek értékelésekor mindenesetre ismét megállapították, hogy a generatív mesterséges intelligenciát talán érdemesebb lenne olyan eszközként pozícionálni, amelynek célja az emberi képességek támogatása, nem pedig a helyettesítése. Az egyik zöldpárti képviselő, akinek főszerepe volt a jelentés közzétételében is, a Crikey riportjában a dolog átláthatóságát és a közvélemény tájékoztatását hiányolta: pozitívumnak tartja ugyan, hogy a kormányhivatalok teszteket végeznek, de az eredményeket maguktól nyilvánosságra kellene hozniuk, nem csak az esetleges szenátusi bizottsági meghallgatások eredményeként.

Piaci hírek

Hasznos trükköt tanult a Gemini

A Google generatív MI-asszisztense mostantól a felhasználói kívánalmak alapján egy sor népszerű fájlformátumban is képes prezentálni válaszát már magában a beszélgetési ablakban.
 
Hirdetés

A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető

Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.