Egy friss kutatás szerint súlyos következményei lehetnek, hogy a nagy nyelvi modellek rosszul általánosítanak a tudományos anyagok tartalmi összefoglalásakor.
Hirdetés
 

A nagy nyelvi modellek (LLM-ek) által működtetett chatbotok egyik legfontosabb képessége az összetett információ közérthető formában való összefoglalása lehet – pontosabban az a sebesség, amivel átrágják magukat a nagy mennyiségű adaton, meghaladva vele az emberi munkára épülő feldolgozás lehetőségeit. Problémát jelent azonban, hogy a tudományos anyagok összefoglalásakor az LLM-ek hajlamosak elhagyni olyan részleteket, amelyek lényegesek lennének a későbbi következtetéseket illetően, és amelyek hiányában az eredeti szövegekhez képest indokolatlan általánosításokhoz vezethetnek a kimeneteikre támaszkodó eredmények is – derül ki a Royal Society oldalán közzétett kutatásból.

Míg az emberi agy ösztönösen képes általános tanulságokat levonni egy-egy konkrét tapasztalatból, a robotok programozásában kihívást jelent a különböző árnyalatok kezelése, amelynek révén eldönthetik, hogy milyen adatokra érdemes összpontosítaniuk. Így aztán igaz, hogy az összefoglalás gyakran túlságosan időigényes munka az emberek számára, és az LLM-ekben nagy lehetőséget látnak például a klinikai alkalmazásokban, de ugyanezekben a környezetekben a részletek súlyozása is rendkívül fontos dolog, sőt a kihagyások könnyen katasztrófákhoz is vezethetnek. Ez pedig minimum aggasztóvá teszi, hogy a nagy nyelvi modelleket mindenhova beerőszakolják az iskolai házi feladatoktól a műszaki tudományokig.

Fejlődés helyett visszafejlődés

A Futurism beszámolója ezzel kapcsolatban kiemeli, hogy egyre több területen merülnek fel a mesterséges intelligenciára jellemző, széles körben tapasztalható pontatlanság. Bár a hurráoptimista marketing értelmében a mesterséges intelligencia egyre csak okosodik, és felgyorsíthatja a tudományos áttöréseket, sőt új tudományágakat hozhat létre, a fenti tanulmány alapján az MI látszólag megbízható válaszainak akár 73 százaléka is tartalmazhat ilyen pontatlanságokat. A tanulmányban 10 hi-tech chatbot közel 5 ezer tudományos összefoglalóját vizsgálták meg, és megállapították, hogy a robotok az emberek által írt tudományos összefoglalókhoz képest ötször több kulcsfontosságú részletet hagytak figyelmen kívül.

A teljesítményük még úgy sem javult, hogy kifejezetten utasították őket a pontosságra, de ennél is érdekesebb, hogy az LLM-ek annál magasabb hibaszázalékkal dolgoztak, minél újabb kiadásról volt szó – ami éppen az ellenkezője az iparágban sulykolt ígéreteknek. A nagy nyelvi modellek alul- vagy túláltalánosításra való hajlama és a használatuk elterjedtsége közötti összefüggés a tanulmány szerzői szerint ugyancsak kockázatot jelent a kutatási eredmények félreértelmezésére. A tudósok megállapítják, hogy maguk a promptok is jelentős hatással lehetnek a kimenetekre, de az további vizsgálatokat igényel, hogy a természettudományos szövegösszefoglalókban megjelenő általánosítások pontosságát hogyan befolyásolják.

Cloud & big data

Hasznos trükköt tanult a Gemini

A Google generatív MI-asszisztense mostantól a felhasználói kívánalmak alapján egy sor népszerű fájlformátumban is képes prezentálni válaszát már magában a beszélgetési ablakban.
 
Hirdetés

A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető

Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.

A biztonság ’balra tolódása’ az alkalmazásfejlesztésben nem csak technikai kérdés. A DevSecOps-elvek érvényesüléséhez az IT-szervezet működését és más területekhez való viszonyát is újra kell szabni.

a melléklet támogatója a Clico

Hirdetés

A hibakeresés nem egyenlő az alkalmazásbiztonsággal

Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.