A Meta előre figyelmeztet rá, hogy új robotja néha túllő a célon

Bitport2022.08.09.Közösség & HR

A BlenderBot 3 sértő vagy valótlan dolgokat is közölhet, sőt időnként arról is elfeledkezhet, hogy ő maga egy chatbot. A Meta azonban nem ennek ellenére, hanem éppen ezért kezdi most meg a publikus tesztelését.

Hirdetés

A Meta olyan beépített biztonsági eljárásokkal tette nyilvánossá a BlenderBot 3 chatbotot, amelyek állítása szerint akár 90 százalékkal csökkentik a program offenzív válaszait, de az ettől még képes illetlenül vagy durván fogalmazni, és következetesen valótlan vagy ellentmondásos dolgokat állítani. A robot demója egyelőre az egyesült államokbeli felhasználók számára érjhető el, de a vállalat tervei szerint hamarosan más országokban is megjelenik. A BlenderBot 3 képes internetes keresések alapján gyakorlatilag bármilyen témáról beszélgetni, és úgy tervezték, hogy megtanulja, hogyan fejlesztheti képességeit és biztonságos működését természetes beszélgetések és valódi emberek visszajelzései alapján.

A társaság kutatásainak kulcsfontosságú része a chatbot nyilvános tesztelésével kapcsolatban, hogy segítsen továbbfejleszteni az említett biztonsági eljárásokat. A Meta közleménye szerint olyan új technikákat alkalmaznak, amelyek a segítőkész felhasználók és a trollok közötti automatikus különbségtételre vonatkozó korábbi vizsgálatokra épülnek. Ezek elvileg támogatják a segítőkész felhasználóktól való tanulást, miközben ezt elkerülik az olyan emberek esetében, amikor valaki a modellt haszontalan vagy kártékony válaszokra próbálja rávenni.

Rögös út vezet a tökéletességhez

Az ilyen kockázatok ma már klasszikusnak számító, 2016-os esete a Microsoft Tay csetbotjának nyilvánossá tétele volt, amikor a program eredményeinek egy 19 éves lányt kellett volna idézniük, de a Twitter-felhasználók visszacsatolásait elemezve órák alatt nőgyűlölő Hitler-szimpatizáns lett belőle. A Meta most arra figyelmeztet, hogy hasonlóra a BlenderBot 3 is képes lehet, vagyis a fejhlesztőknek továbbra is ez a legfőbb megoldatlan problémája. A chatbot oldalán úgy fogalmaznak, hogy a robot az elvégzett munka ellenére is tud olyasmit mondani, amire nem büszkék, de az is előfordulhat, hogy rosszul idéz fel korábbi részleteket, vagy egyenesen megfeledkezik róla, hogy ő maga tulajdonképpen egy chatbot.

A fejlesztők szerint azonban ez még nyomósabb okot ad rá, hogy bevonják a kutatók tágabb közösségét, máskülönben sokkal korlátozottabb lehetőségeik lennének az "észlelési és hatáscsökkentő stratégiák kidolgozására". A Meta ezért arra biztatja a felhasználókat, hogy jelentsék, ha a chatbot bármilyen offenzív megnyiatkozást tesz, vagy ha úgynevezett "hallucinációkat" tapasztalnak – ez utóbbi a Meta leírása alapján azt jelenti, amikor a robot magabiztosan állít valamilyen egyértelműen valótlan dolgot. Ez utóbbi szerintük jellemző a BlenderBot 3-at működtető modellekre, bár azok összesen 175 milliárd paraméterre épülnek, képessé teszik a programot a netes keresésekkel támogatott, nyílt tartományú beszélgetésre, sőt hosszú távú memóriát is biztosítanak neki.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Közösség & HR

A Lidltől érkezik a Yettel új kommunikációs vezetője

A két és fél évtizedes szakmai tapasztalattal rendelkező Tőzsér Judit a vállalati kommunikációért felelős igazgatóság irányítását veszi át a Yettelnél.

A hónap témája

Mesterséges intelligencia mint költségzabáló fekete lyuk?

Nyakunkon az árnyék MI, és valamit kezdeni kell vele. Az elszabaduló kiadások kapcsán a mindenkit érdeklő kérdés így hangzik: hasznunkra lehet a mesterséges intelligencia a költségoptimalizálásban is?

a melléklet támogatója a 4iG

Hirdetés

A "jó gazda" szemlélet menti meg az MI-költségvetést

A 4iG IT minden lehetőséget biztosít ügyfeleinek ahhoz, hogy a FinOps eszközeivel teljes körű kontrollt gyakorolhassanak IT-költéseik felett – még akkor is, ha a mesterséges intelligencia miatt új, nehezen becsülhető, dinamikusan változó költségstruktúrákat kell kezelniük.

CIO Podcast

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

A Lidltől érkezik a Yettel új kommunikációs vezetője

Mesterséges intelligencia mint költségzabáló fekete lyuk?

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia