A kamu vásárlói véleményekre is ráuszították a mesterséges intelligenciát

Bitport2019.03.23.Közösség & HR

Úgy tűnik, hogy a több területen is bizonyított GAN rendszerek a véleményszpemmerek kiszűrésére is kiválóan alkalmasak, ráadásul nincs is szükségük túl sok adatra, hogy megtanulják elkülöníteni a valódi és a hamis információt.

Ma már közhely, hogy a neten hozzáférhető felhasználói vélemények komoly hatással vannak az eladásokra, legyen szó bármiről a használati cikkektől egészen a különböző szolgáltatásokig. A különböző felmérések nyilván más-más eredményt hoznak, de a trendet mindegyik visszaigazolja: ebben az összefoglalóban például olyan statisztikákat idéznek, amelyek szerint tízből kilenc vásárló elismeri, hogy a többi vélemény befolyásolni szokta a döntését, tízből heten pedig arról is beszámolnak, hogy magabiztosabban költi el a pénzét, ha másoktól előzetesen pozitív megerősítést kap.

A kézenfekvő probléma mindezzel kapcsolatban, hogy a megfelelő felületeket elárasztják a névtelenül elhelyezett, manipulatív üzenetek, amelyeket ma már nem ritkán automatizált megoldásokkal generálnak. A harmadik féltől származó, rosszhiszemű értékelések szűrése egyre összetettebb és erőforrás-igényesebb feladat, amire legutóbb a University of Washington és a Hartman Group tudósai adtak előremutató választ – természetesen a mesterséges intelligencia és a gépi tanulás segítségével.

Az MI-ket nem kell ruházni, és most az etetésüket is megoldják

A héten publikált kutatási anyag egyértelmű osztályozási kérdésnek nevezi a kamu és a valódi vélemények elkülönítését, ami ma már általános gondot jelent az e-kereskedelem, a közösségi média, az utazási vagy a fogyasztói értékelő oldalak működésében. Itt a hatékony technikák kifejlesztését eddig nem is igazán az arra alkalmas technológia, sokkal inkább a szükséges méretű és megfelelően osztályozott adatkészletek hiánya okozta – a szakemberek most a spamGAN néven hivatkozott MI-rendszert javasolják a nehézségek feloldására.

A GAN (generative adversarial networks) rövidítéssel két neurális hálózat közös működésére épülő rendszereket szoktak jelölni, amelyek közül az egyik hálózat mindig a generátor (valamilyen információ létrehozója), a másik pedig a diszkriminátor (az információ értékelője). Utóbbi azt próbálja meghatározni, hogy a való világból származó minták hogyan viszonyulnak a másik hálózat által előállított mintákhoz, a visszacsatolás révén pedig az előbbi hálózat folyamatosan tanul, és egyre jobb eredményekre lesz képes.

Ilyen megoldásról számoltunk be nemrég az Nvidia fejlesztése kapcsán is, ahol a GAN technológiával a mesterséges intelligencia teljesen élethűnek látszó emberi arcokat képes létrehozni, vagy igényszerint módosíthatja is a valódi képeket. Bár apróbb hiányosságok abban az esetben is felmerültek, a rendszer ezektől függetlenül ijesztően hatékonynak tűnt – a spamGAN működése most a maga területén hasonlóan ígéretes, miközben választ adhat a rendszerek tanításához szükséges adatkészletek dilemmájára is.

Annyira jól hamisít majd, hogy alig lesz szükség valódi adatokra

A részben felügyelt tanulási technikára (semi-supervised learning) alapuló megközelítés együttesen alkalmazza a nem osztályozott és a sokkal szerényebben adagolt osztályozott adatokat, előrelépést hozva a tanulási folyamat pontosságában. A fenti módszerrel a generátor mondatokat gyárt, a diszkriminátor ezekről megpróbálja bebizonyítani, hogy nem hitelesek, a visszajelzés pedig folyamatosan növeli a generátor osztályozási képességét.

A rendszer tanításához körülbelül 800 darab valódi és 800 darab hamis felhasználói értékelést használtak a TripAdvisor chicagói szállodákat bemutató oldalairól és az Amazonról. A spamGAN-nel a szavak szintjén tokenizált szövegek 80 százalékát dolgoztatták fel, a maradék 20 százalékot pedig az MI-model teljesítményének validációjához haszálták. A tíz alkalommal megismételt kísérletben a rendszer állítólag 71 és 86 százalék közötti pontosságot ért el, miközben a tanításához használt osztályozott adatok aránya alig 10 százalékos volt.

Ez röviden annyit jelent, hogy a spamGAN sokkal kisebb erőfeszítéssel tanítható, és magasabb hatékonysággal működik, mint az ilyen célú megoldások többsége. A kutatók most más adatkészletekkel és szofisztikáltabb osztályozási rendszerrel folytatják a kísérleteket, amelyek végső célja a véleményszpem (opinion spam) jellemzőinek és a szpemmerek viselkedésének MI alapú feldolgozása lenne. Ez nem csak más, alapvetően a manuális azonosításra és heurisztikára épülő kutatásokat váltana ki, de a spamGAN idővel képes lehet saját maga is előállítani jól tipizált szpem- és nem-szpem bejegyzéseket, amivel mesterségesen generálhatnak adatokat a hiányos mérési alapokkal rendelkező esetekhez.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

Nem sok mindenkit érdekel az Apple szuperszemüvege

A beszámolók alapján elolvadt az érdeklődés a Vision Pro headsetek iránt, az Apple néhány üzletében szinte nem is keresik a gyártó legújabb hardveres termékét.

Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A hónap témája

Mennyibe kerül az adat mentése és helyreállítása?

A válasz egyszerű: arról függ, hogy hol, hogyan és milyen szabályozásoknak és üzleti elvárásoknak megfelelően tároljuk az információt. A lényeg azonban a részletekben rejlik.

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Podcast

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

CIO Podcast #58: Valóban mindenre (is) jó az MI?

MÉG TÖBB CIO PODCAST »

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Nem sok mindenkit érdekel az Apple szuperszemüvege

Mennyibe kerül az adat mentése és helyreállítása?

Régen minden jobb volt? A VMware licencelési változásai

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2024 konferencia