A GPTBot a világhálón elérhető publikus tartalomban kutat az MI-modellek tanításához használható adatok után, de részben vagy egészben ki is zárható az oldalakról.
Hirdetés
 

Az OpenAI saját keresőrobotot indított az általa fejlesztett mesterségesintelligencia-termékek, például a GPT-4 multimodális nagy nyelvi modell (LLM) pontosságának és biztonságának fejlesztésére. A társaság hivatalos blogján közzétett bejegyzés szerint a GPTBot névre keresztelt web crawler olyan oldalakat keresve fésüli át az internetet, amelyek adatai potenciálisan felhasználhatók a jövőbeli modellek képzésére, ezzel együtt pedig kiszűri azokat a forrásokat, amelyek előfizetéses tartalmat kínálnak, személyek azonosításra alkalmas információt gyűjtenek, vagy amelyek az OpenAI irányelveinek nem megfelelő anyagokat közölnek.

Az OpenAI és más MI-fejlesztők egy ideje már a figyelem középpontjában állnak, ahogy lényegében minden felporszívóznak a világhálóról a generatív mesterséges intelligencia betanítására használható, minőségi adatok után kutatva. Ahogy nemrég írtuk, a szöveges és képes adatokat összehordó technológiák a szakértők szerint lassan kezdenek falakba ütközni, mivel az adatgyűjtési gyakorlatokat egyre szigorúbb ellenőrzésnek vetik alá, és amiatt is egyre nagyobb a felzúdulás, hogy a jogtulajdonosok vagy a közösségi platformok üzemelztetőinek beleegyezése nélkül gyűjtik és használják a publikusan elérhető alkotásokat.

Kis lépés az emberiségnek

A közlemény alapján a webhelyek üzemeltetői dönthetnek majd úgy, hogy korlátozzák vagy megakadályozzák a GPTBot való hozzáférését akár részlegesen, akár teljes leiratkozással az IP-címen vagy a Robots.txt fájlokon keresztül. A ChatGPT, az OpenAI MI-alapú chatbotjának esetében egyébként csak idén tavasszal vezettek be olyan funkciókat, amelyek révén letilthatók a csevegés előzményei, és a korábbinál jobban szabályozhatóvá válik, hogy a rendszer milyen személyes adatokhoz férhet hozzá. A már feldolgozott információ eltávolítására azonban nincs, és várhatóan nem is lesz mód az meglévő adatkészletekből.

Ez a GPT-3.5-ös és GPT-4-es modellek esetében állítólag a 2021 szeptemberéig begyűjtött online adatokra és szövegekre érvényes, ezzel együtt azonban szaporodnak a figyelmeztetések a generatív MI felhasználását illetően. A személyes alkalmazás mellett elvileg már a webhelyek esetében is be lehet állítani, hogy a GPTBot merre kíváncsiskodhat, de abban senki sem lehet teljesen biztos, hogy később mi történik a bemeneti információval. A gépi tanuló modell sajátosságai miatt pedig előfordul, hogy ezek máshol is visszaköszönnek a kimenetekben, és akár szándékosan is kinyerhetők a megfelelően feltett kérdésekkel, a tanításhoz használt anyagok pedig alkalmassá teszik a rendszereket a plágiummal határos utánzásra.

Közösség & HR

Jól vizsgázott üzletfolytonosságból az ukrán techszektor

Az orosz támadás megindulásakor Harkivban 511 informatikai cég volt. Közülük 500 ma is működik, pedig a munkatársak többsége elköltözött a harcokat közvetlen közelről megszenvedő városból.
 
Az alábbiakban körbejárjuk az Enterprise Service Management fogalmát, és megmutatjuk azt is, miben különbözik az ITSM-től.

a melléklet támogatója a Meta-Inf Kft.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.