A The Register múlt pénteken közölt összeállításában két olyan kutatást is szemléz, amelynek megállapításai szerint a generatív mesterséges intelligenciát egyre gyakrabban használják a tudományos publikációk elkészítéséhez. A tudományos cikkek nyelvészeti és statisztikai elemzése (vagyis a szóválasztás vizsgálata az anyagok korpuszában) ugyanis egyértelműen erre utal: az egyik idézett tanulmány, amelyet a University College London munkatársa tett közzé márciusban, a 2023-ban megjelent publikációk legalább egy százalékát tulajdonítja legalábbis részben a mesterséges intelligenciának.
A másik kutatás, amit a Stanford Egyetem munkatársai közöltek áprilisban, ezt az arányt 6,3 és 17,5 százalék közé teszi a témától függően. Mindkét becslés azoknak a szavaknak és kifejezéseknek az előfordulására épül, amelyeket a nagy nyelvi modellek (LLM-ek) gyakran használnak. Az pedig ugyancsak mindkettő szerint megállapítható, hogy néhány ilyen megfogalmazás elterjedtsége alig változott 2019 és 2022 között, 2022-től mostanáig azonban a duplájára nőtt, vagy még annál is nagyobb arányban bővült.
Ebből is megárt a sok
A statisztikák értelében a számítástechnikai és az elektrotechnikai területen szaporodott el leginkább az MI-re jellemző nyelvhasználat, amihez a stanfordi szerzők azt is hozzátették, hogy az általános időzavar és az egyre értelmetlenebb publikációs kényszer ösztönzi az LLM-ek használatát, amelyek kézenfekvő megoldást nyújtanak a teljesítmény növelésére. Hasonló következtetésekre jutott egyébként a pakisztáni FAST magán-kutatóegyetem egyik professzora is, aki ugyancsak márciusban tette közzé egy több száz egyetemista és doktorandusz bevonásával végzett felmérés eredményét.
A mesterséges intelligencia használata persze nem újdonság a kutatási folyamatokban, de azért a változatos felhasználásokkal együtt is általános elvárás, hogy a tudományos cikkeket valódi emberek írják. Az MI-modellek ebben az összefüggésben különös kockázatokat hordoznak, mert gyakran állítanak elő pontatlan szövegeket, sőt időnként nem létező forrásokat és idézeteket is kitalálnak. A stanfordi tudósok ezértarra figyelmeztetnek, hogy a generatív MI ilyen típusú alkalmazása veszélyezteti a tudományos gyakorlat biztonságát és függetlenségét is.
Az ötlettől az értékteremtésig – a gépi tanulási pipeline szerepe az adattudományi működésben
A jó adatok önmagukban még nem elegendők: a modellek csak akkor működnek megbízhatóan, ha egy átlátható, automatizált és reprodukálható környezetben futnak. A gépi tanulási pipeline-ok éppen ezt a technológiai hátteret teremtik meg.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak