Egy friss kutatás szerint súlyos következményei lehetnek, hogy a nagy nyelvi modellek rosszul általánosítanak a tudományos anyagok tartalmi összefoglalásakor.

A nagy nyelvi modellek (LLM-ek) által működtetett chatbotok egyik legfontosabb képessége az összetett információ közérthető formában való összefoglalása lehet – pontosabban az a sebesség, amivel átrágják magukat a nagy mennyiségű adaton, meghaladva vele az emberi munkára épülő feldolgozás lehetőségeit. Problémát jelent azonban, hogy a tudományos anyagok összefoglalásakor az LLM-ek hajlamosak elhagyni olyan részleteket, amelyek lényegesek lennének a későbbi következtetéseket illetően, és amelyek hiányában az eredeti szövegekhez képest indokolatlan általánosításokhoz vezethetnek a kimeneteikre támaszkodó eredmények is – derül ki a Royal Society oldalán közzétett kutatásból.

Míg az emberi agy ösztönösen képes általános tanulságokat levonni egy-egy konkrét tapasztalatból, a robotok programozásában kihívást jelent a különböző árnyalatok kezelése, amelynek révén eldönthetik, hogy milyen adatokra érdemes összpontosítaniuk. Így aztán igaz, hogy az összefoglalás gyakran túlságosan időigényes munka az emberek számára, és az LLM-ekben nagy lehetőséget látnak például a klinikai alkalmazásokban, de ugyanezekben a környezetekben a részletek súlyozása is rendkívül fontos dolog, sőt a kihagyások könnyen katasztrófákhoz is vezethetnek. Ez pedig minimum aggasztóvá teszi, hogy a nagy nyelvi modelleket mindenhova beerőszakolják az iskolai házi feladatoktól a műszaki tudományokig.

Fejlődés helyett visszafejlődés

A Futurism beszámolója ezzel kapcsolatban kiemeli, hogy egyre több területen merülnek fel a mesterséges intelligenciára jellemző, széles körben tapasztalható pontatlanság. Bár a hurráoptimista marketing értelmében a mesterséges intelligencia egyre csak okosodik, és felgyorsíthatja a tudományos áttöréseket, sőt új tudományágakat hozhat létre, a fenti tanulmány alapján az MI látszólag megbízható válaszainak akár 73 százaléka is tartalmazhat ilyen pontatlanságokat. A tanulmányban 10 hi-tech chatbot közel 5 ezer tudományos összefoglalóját vizsgálták meg, és megállapították, hogy a robotok az emberek által írt tudományos összefoglalókhoz képest ötször több kulcsfontosságú részletet hagytak figyelmen kívül.

A teljesítményük még úgy sem javult, hogy kifejezetten utasították őket a pontosságra, de ennél is érdekesebb, hogy az LLM-ek annál magasabb hibaszázalékkal dolgoztak, minél újabb kiadásról volt szó – ami éppen az ellenkezője az iparágban sulykolt ígéreteknek. A nagy nyelvi modellek alul- vagy túláltalánosításra való hajlama és a használatuk elterjedtsége közötti összefüggés a tanulmány szerzői szerint ugyancsak kockázatot jelent a kutatási eredmények félreértelmezésére. A tudósok megállapítják, hogy maguk a promptok is jelentős hatással lehetnek a kimenetekre, de az további vizsgálatokat igényel, hogy a természettudományos szövegösszefoglalókban megjelenő általánosítások pontosságát hogyan befolyásolják.

Cloud & big data

Meglepetés! Elhülyít minket a ChatGPT használata

Az MIT tudósainak frissen publikált kutatása megerősíti azokat az aggodalmakat, miszerint annyira nem tesz jót az agyműködésünknek, ha túlzottan a generatív algoritmusokra bízzuk magunkat.
 
Hirdetés

Cyber Threat Intelligence: üzleti előny a sötét adatokból

Egyetlen kompromittált jelszó. Egy belépési pont, amit már nem használnak. Egy korábbi alkalmazott adatszivárgása. Ezek ma már nem csupán technikai hibák, hanem valós üzleti fenyegetések, amelyek a digitális alvilág piacán előbb bukkannak fel, mint ahogy a cég egyáltalán észrevenné.

A digitális támadások célpontjai ma már nem feltétlenül azok a vállalatok, amelyektől a támadók adatokat vagy pénzt akarnak szerezni. Elég, ha a támadás egyik láncszeme nem védett – az elkövetők ezen keresztül lépnek be a rendszerbe. És ez a láncszem gyakran nem is belül van.

a melléklet támogatója a One Solutions

Hirdetés

Miért kell az üzleti intelligenciának megelőznie az MI bevezetését?

A felfokozott várakozásokhoz képest kiábrándító az MI-bevezetések valósága, ebben pedig a fő bűnös a rossz adatminőség és nem megfelelő adatinfrastruktúra.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.