Egyetemi kutatók fejlesztették ki a Binoculars nevű eljárást, ami a korábbinál sokkal hatékonyabban szűrheti ki a generatív MI-vel gyártott szövegeket, különös tekintettel a fals pozitív eredmények problémáira.

Amerikai egyetemi kutatói egy új eszköz kifejlesztéséről számoltak be, ami szerintük rendkívüli pontossággal képes azonosítani a generatív MI-alkalmazások és nagy nyelvi modellek (LLM) által előállított szövegeket. A Binoculars néven hivatkozott eljárás ennek alapján jobb teljesítményt nyújt a már rendelkezésre álló megoldásoknál, amelyek az OpenAI ChatGPT-jével és más szolgáltatásokkal gyártott hírek, kreatív írások vagy tanulói fogalmazások kiszűrésére szolgálnak: a vizsgált adatkészletek MI-vel készített mintáinak több mint 90 százalékát észlelte, ráadásul 99,9 százalékos pontossággal, vagyis 0,01 százalék fals pozitív riasztás mellett.

A Business Insider riportja a Binoculars kapcsán emlékeztet rá, hogy a generatív mesterséges intelligencia nem csak amiatt ad okot aggodalomra, hogy a diákok például a sajátjukként adják le az MI-vel tákolt dolgozatokat, hanem amiatt is, hogy sokukat jogtalanul vádolták meg csalással az észlelő eszközök téves eredményei alapján. A lap felidézi, hogy amikor a Vanderbilt Egyetem felhagyott az egyik ilyen program, a Turnitin használatával, akkor annak 1 százalékos hamis pozitív arányára hivatkozott, mivel még abból is az következne, hogy diákok százait vádolhatják meg érdemtelenül a mesterséges intelligenciával való ügyeskedéssel.

Nem tanítják rá semmire, ezért mindenben jobb lehet

A kutatók most azt fontolgatják, hogy technológiájukat egy könnyebben használható, licencelhető termékké fejlesztik. Ahogy egyikük a Business Insidernek elmondta, az LLM-ek kimeneteinek felismerésében nagy előrelépések történtek az elmúlt fél évben, az általuk épített rendszernek pedig az az egyik előnye, hogy a kereskedelmi érzékelőrendszerekkel ellentétben nem hangolták egy-egy MI-modell, mondjuk a ChatGPT nyomainak felismerésére, mégis jobban teljesít azoknál a konkrét esetekben. Ezt a "modellagnosztikus" észlelési képességet kritikusnak tartják a közösségi média moderálását és a platformok integritását illetően.

A "zero-shot" megközelítés mellett a Binoculars egy "előadónak" és egy "megfigyelőnek" használt LLM-et alkalmaz, és azt méri, hogy a vizsgált szövegláncokban a statisztikai alapon működő modellek mennyire értékelik meglepőnek a soron következő elemeket. Az emberek ugyanis ebben a tekintetben kiszámíthatatlanabb dolgokat produkálnak, tehát minél kevésbé éri váratlanul mindkét LLM-et a lánc fejlődése (ezt a dokumentumban "keresztzavarnak" nevezik), annál valószínűbb, hogy a szöveg egy géptől származik – a módszer emellett korrigálja a promptokat adó személyek szerepét is a kimenetekben, amit a fals pozitívok fő okaként jellemeznek.

A Binoculars publikációja a Hugging Face oldalán érhető el »

Közösség & HR

Ki kell fizetnie a Google-nek az EU-s rekordbüntetést

Egy 2018 óta húzódó ügy végére került pont tegnap azzal, hogy az Európai Unió Bírósága tegnap helyben hagyta a versenykorlátozó intézkedések miatt a Google-re kiszabott 4,1 milliárd eurós EU-s bírságot.
 
A hurráoptimizmusnak régen vége, a fejlesztések sem technikai köntösben zajlanak már, hanem üzleti, jogi és kockázatkezelési megfontolások dominálnak. Belépőben vagyunk a cloud második korszakába.

a melléklet támogatója a ONE Solutions

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.