Aki tényleg ért hozzá, annak visszalépés is lehet a mesterséges intelligencia

Bitport2025.07.11.Közösség & HR

A legújabb MI-eszközök használata sokszor inkább lelassítja, semhogy felgyorsítaná a tapasztalt szoftverfejlesztők munkáját, amikor ismerős kódbázisokkal dolgoznak – derül ki egy frissen közölt kutatásból.

A METR (Model Evaluation and Threat Research) egy tapasztalt fejlesztőkből álló csoporttal végzett vizsgálatokat egy népszerű MI-alapú asszisztens, a Cursor használatáról a számukra már ismerős nyílt forráskódú projektekben. A fejlett gépi tanuló modellekkel foglalkozó nonprofit szervezet ennek során úgy találta, hogy az új eszköz a közhiedelemmel ellentétben inkább csak lassította a szakemberek munkáját, amikor a jól ismert kódbázisokkal dolgoztak. Bár a lehetséges felhasználásokat ezzel közel sem fedték le, azt a tételt sikerült cáfolniuk, hogy a mesterséges intelligencia minden esetben sokkal termelékenyebbé tenné a humán mérnökök munkáját.

A dolog azért érdekes, mert a szoftverfejlesztést segítő mesterségesintelligencia-termékek éppen azzal vonzzák a befektetéseket, hogy általánosságban növelik a hatékonyságot. A Reuters beszámolója például olyan korábbi jelentéseket idéz, amelyek szerint az MI nem kevesebb mint 56 százalékkal gyorsíthatja a kódolást, a fejlesztők pedig átlagosan 26 százalékkal több feladatot tudtak elvégezni adott idő alatt. A METR tanulmányából azonban kiderül, hogy ez legalábbis nem minden forgatókönyvre igaz, a hivatkozott benchmarkoknál pedig – hasonóan más MI-alkalmazásokhoz – a referenciaértékek időnként nem megfelelően reprezentálják a valós feladatokat.

Aki benne van, az nem versenyezni akar

A mostani tanulmány alapján maguk a fejlesztők is azt jósolták feladatok megkezdése előtt, hogy a mesterséges intelligencia használata 24 százalékkal csökkenti majd a szükséges időt, és a vizsgálatok elvégzését követően is azt saccolták, hogy ilyenkor 20 százalékkal gyorsabban végeztek, mint ahogy az MI-asszisztens nélkül tehették volna. Ehhez képest a mesterséges intelligencia engedélyezése valójában 19 százalékkal növelte a ráfordított időt, vagyis lényegében lelassította a mérnökök munkáját, ami nyilvánvalóan ellentmondott a gazdasági szakértők és a gépi tanulással foglalkozó szakemberek rendre 39, illetve 38 százalékos előzetes becsléseinek is.

Még a tanulmány szerzői sem erre számítottak: vizsgálataik során arra jutottak, hogy a fejlesztőknek időt kellett szánniuk az MI-modellek által javasolt dolgok átnézésére és javítására. Ez utóbbi nem feltétlenül jelenti, hogy a mesterséges intelligencia hibás kimeneteket adott, egyszerűen csak nem pontosan azt hozta, amire a tapasztalt szakembereknek szükségük lett volna. A lassulás éppen ezért nem lenne érvényes a kezdő vagy az ismeretlen kódbázisokkal dolgozó mérnökök esetében, és az is lényeges, hogy a résztvevők többsége szerint az MI így is javítja a fejlesztési élményt – vagyis nem az az egyetlen céljuk, hogy minél gyorsabban végezzenek a feladatokkal.

Részletek a METR blogján »

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

Megmakacsolta magát, óriási uniós bírságra készülhet a Meta

A Reuters szerint a Facebook tulajdonosa nem hajlandó további változtatásokra a felhasználói adatok kezelését is érintő előfizetéses modelljében, ami napi szintű bírságot érhet az Európai Unióban.

A hónap témája

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

A kompromittált rendszerek, a dark weben felbukkanó ügyféladatok vagy a zsarolóvírus-kampányok következményei már a vezérigazgatói és pénzügyi igazgatói irodában csapódnak le – jogi, reputációs és üzleti szinten is. Lehet és kell is védekezni ellene.

CIO Podcast

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Megmakacsolta magát, óriási uniós bírságra készülhet a Meta

Hogyan értesüljön az elsők között a vezetőség is a fenyegetésekről?

CIO Podcast #60: Megoldottuk a projektmenedzsment összes problémáját

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2025 konferencia