A The Register múlt pénteken közölt összeállításában két olyan kutatást is szemléz, amelynek megállapításai szerint a generatív mesterséges intelligenciát egyre gyakrabban használják a tudományos publikációk elkészítéséhez. A tudományos cikkek nyelvészeti és statisztikai elemzése (vagyis a szóválasztás vizsgálata az anyagok korpuszában) ugyanis egyértelműen erre utal: az egyik idézett tanulmány, amelyet a University College London munkatársa tett közzé márciusban, a 2023-ban megjelent publikációk legalább egy százalékát tulajdonítja legalábbis részben a mesterséges intelligenciának.
A másik kutatás, amit a Stanford Egyetem munkatársai közöltek áprilisban, ezt az arányt 6,3 és 17,5 százalék közé teszi a témától függően. Mindkét becslés azoknak a szavaknak és kifejezéseknek az előfordulására épül, amelyeket a nagy nyelvi modellek (LLM-ek) gyakran használnak. Az pedig ugyancsak mindkettő szerint megállapítható, hogy néhány ilyen megfogalmazás elterjedtsége alig változott 2019 és 2022 között, 2022-től mostanáig azonban a duplájára nőtt, vagy még annál is nagyobb arányban bővült.
Ebből is megárt a sok
A statisztikák értelében a számítástechnikai és az elektrotechnikai területen szaporodott el leginkább az MI-re jellemző nyelvhasználat, amihez a stanfordi szerzők azt is hozzátették, hogy az általános időzavar és az egyre értelmetlenebb publikációs kényszer ösztönzi az LLM-ek használatát, amelyek kézenfekvő megoldást nyújtanak a teljesítmény növelésére. Hasonló következtetésekre jutott egyébként a pakisztáni FAST magán-kutatóegyetem egyik professzora is, aki ugyancsak márciusban tette közzé egy több száz egyetemista és doktorandusz bevonásával végzett felmérés eredményét.
A mesterséges intelligencia használata persze nem újdonság a kutatási folyamatokban, de azért a változatos felhasználásokkal együtt is általános elvárás, hogy a tudományos cikkeket valódi emberek írják. Az MI-modellek ebben az összefüggésben különös kockázatokat hordoznak, mert gyakran állítanak elő pontatlan szövegeket, sőt időnként nem létező forrásokat és idézeteket is kitalálnak. A stanfordi tudósok ezértarra figyelmeztetnek, hogy a generatív MI ilyen típusú alkalmazása veszélyezteti a tudományos gyakorlat biztonságát és függetlenségét is.
Az ötlettől az értékteremtésig – egy jól működő adattudományi szervezet alapjai
Miért bukik el annyi adattudományi kezdeményezés már az indulás után? A válasz gyakran nem az algoritmusok összetettségében, hanem az adatok minőségében és kezelésében keresendő. Stabil adatforrások, következetes feature-kezelés és egy jól felépített Feature Store nélkül a gépi tanulás ritkán jut el a valódi üzleti értékteremtésig.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak