A diákok a ChatGPT bő másfél évvel ezelőtti megjelenésekor szinte azonnal meglátták a lehetőséget a nagy nyelvi modellekre épülő chatbotokban, ami valóságos pánikot keltett az oktatási intézmények vezetőségében. Egy friss kutatás nemrégiben rávilágított arra is, hogy a hallgatók mellett a tudományos világ elismert tekintélyei sem ódzkodnak egy kis gépi segítségtől.
Az egyesült államokbeli Northwestern Egyetem és a német Tubingeni Egyetem munkatársaiból verbuválódott négyfős nemzetközi kutatócsapat múlt hónapban publikált tanulmánya alapján megállapítható, hogy az elmúlt másfél évben jelentős súlyponteltolódások figyelhetők meg az angol nyelvű tudományos anyagok szóhasználatában. (Zárójeles érdekesség, hogy a csapat egyik tagja az erdélyi származású, jelenleg az USA-ban dolgozó Horvát Emőke Ágnes.)
A munkát az a gyakorlat inspirálta, ahogy a Covidhoz köthető halálozásokat a tudósok úgy igyekeztek számszerűsíteni, hogy a korábbi halálozási adatokat összevetették a pandémia idején regisztrált esetekkel. Elhunytak helyett azonban itt szavakat számoltak, és megnézték, mennyiben térnek el azok a ChatGPT elterjedését megelőző időszakhoz képest.
A vizsgálat alapját a PubMed felületén 2010 és 2024 között közzétett mintegy 14 millió egészségügyi tanulmánykivonat adta. Kiderült, 2023-tól kezdve számos olyan kifejezést találni, amelyek használata ugrászszerű emelkedést mutatott. A delves (elmélyül) ige például az idei anyagokban 25-ször többször bukkant fel, mint a 2022 végéig tartó periódusban. Ennél kisebb, de így is szignifikáns, kilencszeres megjelenési arányt hozott az elmúlt időszak a showcasing (bemutatás) és az underscores (aláhúzza) kifejezések esetében.
A nyelv természeténél fogva is folyamatos változásban van: bizonyos kifejezések kikopnak, mások megjelennek, felerősödnek a szóhasználatban. A tanulmány készítői azonban úgy gondolják, hogy az általuk kimutatott változások túlmutatnak ezen a természetes folyamaton, ráadásul semmiféle egyéb nagy hatásfokú eseményhez nem kapcsolhatók. (A koronavírus idején értelemszerűen többször előkerültek a karantén, a lezárás vagy éppen az otthoni munkavégzés kifejezések.)
Nem félnek használni
A jelzőszavak beazonosítását követően a csapat elemezte a friss szövegeket, és arra jutott, hogy a 2023-24 között publikált tudományos értekezések minimum 10 százalékánál támaszkodtak szövegalkotó algoritmusra. Ez nyilván nem azt jelenti, hogy teljes egészében egy chatbottal íratták meg az anyagot, de a kulcsszavak előfordulása alapján nagy biztonsággal kijelenthető, hogy egyes bekezdések megfogalmazását a gépre bízták. A csapat az "A [...] és [...] közötti bonyolult kölcsönhatás átfogó megértése kulcsfontosságú a hatékony terápiás stratégiákhoz." mondattal illusztrálta, mennyire koncentrált lehet a keresett szavak előfordulása.
Önmagában a kimutatott 10 százalék sem tekinthető alacsony rátának, de a projekten dolgozók szerint ez inkább alsó becslése a tényleges aránynak. Elvégre bőven alkothatott olyan mondatokat, bekezdéseket az MI, amelyekben nem használta jelzőszóként azonosított kifejezéseket.
További érdekesség, hogy a kínai, dél-koreai, tajvani szerzők esetében az arány 15 százalékra jött ki. Ebből ugyanakkor elhamarkodott lenne bármiféle következtetést levonni, hiszen elképzelhető, hogy az ázsiai kutatók nem lustaságból, hanem azért fordulnak az MI-hez, mert nem anyanyelvi szinten beszélik az angolt. Ráadásul a perfekt angollal bírók esetében nagyobb az esély arra is, hogy kiszúrják és javítják a gép által kreált, mesterkéltnek hangzó mondatokat.
Bármekkora is a valódi arány, a nagy nyelvi modellek intenzív használatától óva intenek a mostani kutatás lebonyolítói, mivel a generatív MI már rengeteg példát szolgáltatott arra, hogy képes nem létező dolgokat valóságként beállítani, hivatkozásokat kreálni, vagy éppen pontatlan összefoglalókat gyártani.
Rendszerek és emberek: a CIO választásai egy új magyar felmérés tükrében
"Nehéz informatikusnak lenni egy olyan cégben, ahol sok az IT-s" – jegyezte meg egy egészségügyi technológiákat fejlesztő cég informatikai vezetője, amikor megkérdeztük, milyennek látja házon belül az IT és a többi osztály közötti kommunikációt.
Így lehet sok önálló kiberbiztonsági eszközéből egy erősebbet csinálni
A kulcsszó a platform. Ha egy cég jó platformot választ, akkor az egyes eszközök előnyei nem kioltják, hanem erősítik egymást, és még az üzemeltetés is olcsóbb lesz.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak