A tudományos munkák jelentős részében vállal szerepet a generatív MI

Bitport2024.07.04.Piaci hírek

Egy kutatócsapat megvizsgálta, miként változott az elmúlt két évben a tudományos értekezések szóhasználata. Úgy tűnik, a ChatGPT megjelenése nyelvi reformot is hozott.

Hirdetés

A diákok a ChatGPT bő másfél évvel ezelőtti megjelenésekor szinte azonnal meglátták a lehetőséget a nagy nyelvi modellekre épülő chatbotokban, ami valóságos pánikot keltett az oktatási intézmények vezetőségében. Egy friss kutatás nemrégiben rávilágított arra is, hogy a hallgatók mellett a tudományos világ elismert tekintélyei sem ódzkodnak egy kis gépi segítségtől.

Az egyesült államokbeli Northwestern Egyetem és a német Tubingeni Egyetem munkatársaiból verbuválódott négyfős nemzetközi kutatócsapat múlt hónapban publikált tanulmánya alapján megállapítható, hogy az elmúlt másfél évben jelentős súlyponteltolódások figyelhetők meg az angol nyelvű tudományos anyagok szóhasználatában. (Zárójeles érdekesség, hogy a csapat egyik tagja az erdélyi származású, jelenleg az USA-ban dolgozó Horvát Emőke Ágnes.)

A munkát az a gyakorlat inspirálta, ahogy a Covidhoz köthető halálozásokat a tudósok úgy igyekeztek számszerűsíteni, hogy a korábbi halálozási adatokat összevetették a pandémia idején regisztrált esetekkel. Elhunytak helyett azonban itt szavakat számoltak, és megnézték, mennyiben térnek el azok a ChatGPT elterjedését megelőző időszakhoz képest.

A vizsgálat alapját a PubMed felületén 2010 és 2024 között közzétett mintegy 14 millió egészségügyi tanulmánykivonat adta. Kiderült, 2023-tól kezdve számos olyan kifejezést találni, amelyek használata ugrászszerű emelkedést mutatott. A delves (elmélyül) ige például az idei anyagokban 25-ször többször bukkant fel, mint a 2022 végéig tartó periódusban. Ennél kisebb, de így is szignifikáns, kilencszeres megjelenési arányt hozott az elmúlt időszak a showcasing (bemutatás) és az underscores (aláhúzza) kifejezések esetében.

A nyelv természeténél fogva is folyamatos változásban van: bizonyos kifejezések kikopnak, mások megjelennek, felerősödnek a szóhasználatban. A tanulmány készítői azonban úgy gondolják, hogy az általuk kimutatott változások túlmutatnak ezen a természetes folyamaton, ráadásul semmiféle egyéb nagy hatásfokú eseményhez nem kapcsolhatók. (A koronavírus idején értelemszerűen többször előkerültek a karantén, a lezárás vagy éppen az otthoni munkavégzés kifejezések.)

Nem félnek használni

A jelzőszavak beazonosítását követően a csapat elemezte a friss szövegeket, és arra jutott, hogy a 2023-24 között publikált tudományos értekezések minimum 10 százalékánál támaszkodtak szövegalkotó algoritmusra. Ez nyilván nem azt jelenti, hogy teljes egészében egy chatbottal íratták meg az anyagot, de a kulcsszavak előfordulása alapján nagy biztonsággal kijelenthető, hogy egyes bekezdések megfogalmazását a gépre bízták. A csapat az "A [...] és [...] közötti bonyolult kölcsönhatás átfogó megértése kulcsfontosságú a hatékony terápiás stratégiákhoz." mondattal illusztrálta, mennyire koncentrált lehet a keresett szavak előfordulása.

Önmagában a kimutatott 10 százalék sem tekinthető alacsony rátának, de a projekten dolgozók szerint ez inkább alsó becslése a tényleges aránynak. Elvégre bőven alkothatott olyan mondatokat, bekezdéseket az MI, amelyekben nem használta jelzőszóként azonosított kifejezéseket.

További érdekesség, hogy a kínai, dél-koreai, tajvani szerzők esetében az arány 15 százalékra jött ki. Ebből ugyanakkor elhamarkodott lenne bármiféle következtetést levonni, hiszen elképzelhető, hogy az ázsiai kutatók nem lustaságból, hanem azért fordulnak az MI-hez, mert nem anyanyelvi szinten beszélik az angolt. Ráadásul a perfekt angollal bírók esetében nagyobb az esély arra is, hogy kiszúrják és javítják a gép által kreált, mesterkéltnek hangzó mondatokat.

Bármekkora is a valódi arány, a nagy nyelvi modellek intenzív használatától óva intenek a mostani kutatás lebonyolítói, mivel a generatív MI már rengeteg példát szolgáltatott arra, hogy képes nem létező dolgokat valóságként beállítani, hivatkozásokat kreálni, vagy éppen pontatlan összefoglalókat gyártani.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Piaci hírek

A terroristák mellett már a hekkerekkel se tárgyal szinte senki

Az utóbbi időszakban folyamatosan csökkent azok aránya, akik egy sikeres zsarolóvírusos támadás után hajlandóak voltak szóba állni az elkövetőkkel.

Hirdetés

Az end-to-end védelmeké a jövő

A kódbiztonság integrálásával új fejlődési szakaszukba léptek a felhős védelmi platformok. Werner Obringot, a Clico Hungary cloud security architektjét kérdeztük a miértekről és hogyanokról.

A hónap témája

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

A biztonsági megoldásszállítók érthető módon egy irányba mozdulnak, hiszen ugyanazoknak a támadásoknak az ellenszerét keresik. Megoldási javaslataikban sokszor csak árnyalatnyiak a különbségek, ami egyszerre könnyíti és nehezíti a választást.

a melléklet támogatója a Clico Hungary

CIO Podcast

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

A terroristák mellett már a hekkerekkel se tárgyal szinte senki

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia