A GPTBot a világhálón elérhető publikus tartalomban kutat az MI-modellek tanításához használható adatok után, de részben vagy egészben ki is zárható az oldalakról.

Az OpenAI saját keresőrobotot indított az általa fejlesztett mesterségesintelligencia-termékek, például a GPT-4 multimodális nagy nyelvi modell (LLM) pontosságának és biztonságának fejlesztésére. A társaság hivatalos blogján közzétett bejegyzés szerint a GPTBot névre keresztelt web crawler olyan oldalakat keresve fésüli át az internetet, amelyek adatai potenciálisan felhasználhatók a jövőbeli modellek képzésére, ezzel együtt pedig kiszűri azokat a forrásokat, amelyek előfizetéses tartalmat kínálnak, személyek azonosításra alkalmas információt gyűjtenek, vagy amelyek az OpenAI irányelveinek nem megfelelő anyagokat közölnek.

Az OpenAI és más MI-fejlesztők egy ideje már a figyelem középpontjában állnak, ahogy lényegében minden felporszívóznak a világhálóról a generatív mesterséges intelligencia betanítására használható, minőségi adatok után kutatva. Ahogy nemrég írtuk, a szöveges és képes adatokat összehordó technológiák a szakértők szerint lassan kezdenek falakba ütközni, mivel az adatgyűjtési gyakorlatokat egyre szigorúbb ellenőrzésnek vetik alá, és amiatt is egyre nagyobb a felzúdulás, hogy a jogtulajdonosok vagy a közösségi platformok üzemelztetőinek beleegyezése nélkül gyűjtik és használják a publikusan elérhető alkotásokat.

Kis lépés az emberiségnek

A közlemény alapján a webhelyek üzemeltetői dönthetnek majd úgy, hogy korlátozzák vagy megakadályozzák a GPTBot való hozzáférését akár részlegesen, akár teljes leiratkozással az IP-címen vagy a Robots.txt fájlokon keresztül. A ChatGPT, az OpenAI MI-alapú chatbotjának esetében egyébként csak idén tavasszal vezettek be olyan funkciókat, amelyek révén letilthatók a csevegés előzményei, és a korábbinál jobban szabályozhatóvá válik, hogy a rendszer milyen személyes adatokhoz férhet hozzá. A már feldolgozott információ eltávolítására azonban nincs, és várhatóan nem is lesz mód az meglévő adatkészletekből.

Ez a GPT-3.5-ös és GPT-4-es modellek esetében állítólag a 2021 szeptemberéig begyűjtött online adatokra és szövegekre érvényes, ezzel együtt azonban szaporodnak a figyelmeztetések a generatív MI felhasználását illetően. A személyes alkalmazás mellett elvileg már a webhelyek esetében is be lehet állítani, hogy a GPTBot merre kíváncsiskodhat, de abban senki sem lehet teljesen biztos, hogy később mi történik a bemeneti információval. A gépi tanuló modell sajátosságai miatt pedig előfordul, hogy ezek máshol is visszaköszönnek a kimenetekben, és akár szándékosan is kinyerhetők a megfelelően feltett kérdésekkel, a tanításhoz használt anyagok pedig alkalmassá teszik a rendszereket a plágiummal határos utánzásra.

Közösség & HR

Működőképes-e a magyar MI-stratégia?

Az IVSZ is véleményezte a Nagy Márton és Palkovics László jegyezte stratégiát.
 
Hirdetés

A kifizetett energia
60%-a elvész, de egy audit feltárja, hol folyik el a pénzünk

A Schneider Electric energiahatékonysági szolgáltatása átfogó megoldást kínál, amely támogatja a cégek energiahatékonyság-növelési programjaik megvalósításában, az iparágban vezető megoldások, szolgáltatások és szakértők segítségével.

A vállalati IT-rendszerek egyik legnagyobb kihívása ma már nem a hardver beszerzése vagy a szoftverek integrációja, hanem az üzemeltetés. A modern storage-megoldások válasza erre az automatizáció és a menedzsment egyszerűsítése.

a melléklet támogatója az EURO ONE

Hirdetés

Hatékony adattárolás, biztonságosabb működés: HPE storage az EURO ONE szakértelmével

Az adatmennyiség rohamos növekedése, a kritikus üzleti alkalmazások rendelkezésre állási követelményei és a kiberbiztonsági fenyegetések mind olyan tényezők, amelyek túlmutatnak a hagyományos storage-megoldások képességein.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.