Ez lehet az eddigi legjobb megoldás az MI nyomainak szimatolására

Bitport2024.01.26.Közösség & HR

Egyetemi kutatók fejlesztették ki a Binoculars nevű eljárást, ami a korábbinál sokkal hatékonyabban szűrheti ki a generatív MI-vel gyártott szövegeket, különös tekintettel a fals pozitív eredmények problémáira.

Amerikai egyetemi kutatói egy új eszköz kifejlesztéséről számoltak be, ami szerintük rendkívüli pontossággal képes azonosítani a generatív MI-alkalmazások és nagy nyelvi modellek (LLM) által előállított szövegeket. A Binoculars néven hivatkozott eljárás ennek alapján jobb teljesítményt nyújt a már rendelkezésre álló megoldásoknál, amelyek az OpenAI ChatGPT-jével és más szolgáltatásokkal gyártott hírek, kreatív írások vagy tanulói fogalmazások kiszűrésére szolgálnak: a vizsgált adatkészletek MI-vel készített mintáinak több mint 90 százalékát észlelte, ráadásul 99,9 százalékos pontossággal, vagyis 0,01 százalék fals pozitív riasztás mellett.

A Business Insider riportja a Binoculars kapcsán emlékeztet rá, hogy a generatív mesterséges intelligencia nem csak amiatt ad okot aggodalomra, hogy a diákok például a sajátjukként adják le az MI-vel tákolt dolgozatokat, hanem amiatt is, hogy sokukat jogtalanul vádolták meg csalással az észlelő eszközök téves eredményei alapján. A lap felidézi, hogy amikor a Vanderbilt Egyetem felhagyott az egyik ilyen program, a Turnitin használatával, akkor annak 1 százalékos hamis pozitív arányára hivatkozott, mivel még abból is az következne, hogy diákok százait vádolhatják meg érdemtelenül a mesterséges intelligenciával való ügyeskedéssel.

Nem tanítják rá semmire, ezért mindenben jobb lehet

A kutatók most azt fontolgatják, hogy technológiájukat egy könnyebben használható, licencelhető termékké fejlesztik. Ahogy egyikük a Business Insidernek elmondta, az LLM-ek kimeneteinek felismerésében nagy előrelépések történtek az elmúlt fél évben, az általuk épített rendszernek pedig az az egyik előnye, hogy a kereskedelmi érzékelőrendszerekkel ellentétben nem hangolták egy-egy MI-modell, mondjuk a ChatGPT nyomainak felismerésére, mégis jobban teljesít azoknál a konkrét esetekben. Ezt a "modellagnosztikus" észlelési képességet kritikusnak tartják a közösségi média moderálását és a platformok integritását illetően.

A "zero-shot" megközelítés mellett a Binoculars egy "előadónak" és egy "megfigyelőnek" használt LLM-et alkalmaz, és azt méri, hogy a vizsgált szövegláncokban a statisztikai alapon működő modellek mennyire értékelik meglepőnek a soron következő elemeket. Az emberek ugyanis ebben a tekintetben kiszámíthatatlanabb dolgokat produkálnak, tehát minél kevésbé éri váratlanul mindkét LLM-et a lánc fejlődése (ezt a dokumentumban "keresztzavarnak" nevezik), annál valószínűbb, hogy a szöveg egy géptől származik – a módszer emellett korrigálja a promptokat adó személyek szerepét is a kimenetekben, amit a fals pozitívok fő okaként jellemeznek.

A Binoculars publikációja a Hugging Face oldalán érhető el »

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

Iráni rakéták fenyegetik a Stargate közel-keleti adatközpontjait

Az adatközpontokat is katonai célpontnak tekintik, az AWS és az Oracle infrastruktúrájának támadását követően a létesítményeket jelölő műholdképeket és újabb fenyegetéseket tettek közzé.

A hónap témája

Alkalmazásbiztonság: nem fejlődik, hanem gyökeresen átalakul

Az új technológiák alapjaiban írják át az alkalmazásbiztonság szabályait. Most hatványozottan igaz, hogy szárazon kell tartani a puskaport.

a melléklet támogatója a Clico

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Iráni rakéták fenyegetik a Stargate közel-keleti adatközpontjait

Alkalmazásbiztonság: nem fejlődik, hanem gyökeresen átalakul

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!