Egy kutatócsapat megvizsgálta, miként változott az elmúlt két évben a tudományos értekezések szóhasználata. Úgy tűnik, a ChatGPT megjelenése nyelvi reformot is hozott.

A diákok a ChatGPT bő másfél évvel ezelőtti megjelenésekor szinte azonnal meglátták a lehetőséget a nagy nyelvi modellekre épülő chatbotokban, ami valóságos pánikot keltett az oktatási intézmények vezetőségében. Egy friss kutatás nemrégiben rávilágított arra is, hogy a hallgatók mellett a tudományos világ elismert tekintélyei sem ódzkodnak egy kis gépi segítségtől.

Az egyesült államokbeli Northwestern Egyetem és a német Tubingeni Egyetem munkatársaiból verbuválódott négyfős nemzetközi kutatócsapat múlt hónapban publikált tanulmánya alapján megállapítható, hogy az elmúlt másfél évben jelentős súlyponteltolódások figyelhetők meg az angol nyelvű tudományos anyagok szóhasználatában. (Zárójeles érdekesség, hogy a csapat egyik tagja az erdélyi származású, jelenleg az USA-ban dolgozó Horvát Emőke Ágnes.)

A munkát az a gyakorlat inspirálta, ahogy a Covidhoz köthető halálozásokat a tudósok úgy igyekeztek számszerűsíteni, hogy a korábbi halálozási adatokat összevetették a pandémia idején regisztrált esetekkel. Elhunytak helyett azonban itt szavakat számoltak, és megnézték, mennyiben térnek el azok a ChatGPT elterjedését megelőző időszakhoz képest.

A vizsgálat alapját a PubMed felületén 2010 és 2024 között közzétett mintegy 14 millió egészségügyi tanulmánykivonat adta. Kiderült, 2023-tól kezdve számos olyan kifejezést találni, amelyek használata ugrászszerű emelkedést mutatott. A delves (elmélyül) ige például az idei anyagokban 25-ször többször bukkant fel, mint a 2022 végéig tartó periódusban. Ennél kisebb, de így is szignifikáns, kilencszeres megjelenési arányt hozott az elmúlt időszak a showcasing (bemutatás) és az underscores (aláhúzza) kifejezések esetében.

A nyelv természeténél fogva is folyamatos változásban van: bizonyos kifejezések kikopnak, mások megjelennek, felerősödnek a szóhasználatban. A tanulmány készítői azonban úgy gondolják, hogy az általuk kimutatott változások túlmutatnak ezen a természetes folyamaton, ráadásul semmiféle egyéb nagy hatásfokú eseményhez nem kapcsolhatók. (A koronavírus idején értelemszerűen többször előkerültek a karantén, a lezárás vagy éppen az otthoni munkavégzés kifejezések.)

Nem félnek használni

A jelzőszavak beazonosítását követően a csapat elemezte a friss szövegeket, és arra jutott, hogy a 2023-24 között publikált tudományos értekezések minimum 10 százalékánál támaszkodtak szövegalkotó algoritmusra. Ez nyilván nem azt jelenti, hogy teljes egészében egy chatbottal íratták meg az anyagot, de a kulcsszavak előfordulása alapján nagy biztonsággal kijelenthető, hogy egyes bekezdések megfogalmazását a gépre bízták. A csapat az "A [...] és [...] közötti bonyolult kölcsönhatás átfogó megértése kulcsfontosságú a hatékony terápiás stratégiákhoz." mondattal illusztrálta, mennyire koncentrált lehet a keresett szavak előfordulása.

Önmagában a kimutatott 10 százalék sem tekinthető alacsony rátának, de a projekten dolgozók szerint ez inkább alsó becslése a tényleges aránynak. Elvégre bőven alkothatott olyan mondatokat, bekezdéseket az MI, amelyekben nem használta jelzőszóként azonosított kifejezéseket.

További érdekesség, hogy a kínai, dél-koreai, tajvani szerzők esetében az arány 15 százalékra jött ki. Ebből ugyanakkor elhamarkodott lenne bármiféle következtetést levonni, hiszen elképzelhető, hogy az ázsiai kutatók nem lustaságból, hanem azért fordulnak az MI-hez, mert nem anyanyelvi szinten beszélik az angolt. Ráadásul a perfekt angollal bírók esetében nagyobb az esély arra is, hogy kiszúrják és javítják a gép által kreált, mesterkéltnek hangzó mondatokat. 

Bármekkora is a valódi arány, a nagy nyelvi modellek intenzív használatától óva intenek a mostani kutatás lebonyolítói, mivel a generatív MI már rengeteg példát szolgáltatott arra, hogy képes nem létező dolgokat valóságként beállítani, hivatkozásokat kreálni, vagy éppen pontatlan összefoglalókat gyártani.

Piaci hírek

Egyre kevésbé férnek hozzá az MI-fejlesztők a létfontosságú adatokhoz

A tartalomszolgáltatók sorra vezetik be a korlátozásokat az általuk közölt anyagok felhasználására, miközben a mesterséges intelligencia egyre többet követelne magának.
 
Általános jelenség a hazai nagyvállalatok körében, hogy a szükségesnél jelentősen többet költenek nyilvánosfelhő-szolgáltatásokra. Utánajártunk, mi a pontos helyzet, és mit lehet tenni a költségek optimalizálásáért.

a melléklet támogatója a 4iG Nyrt.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.