A házon belül lefolytatott kísérleti projekt során az algoritmus stabilan szállította a furcsábbnál furcsább megoldásokat. A cég igyekszik az itt leszűrt tapasztalatokat a modellek fejlesztésénél kamatoztatni.

Érdekes kísérlet zajlott az év elején az Anthropic falain belül. Utóbbi szó szerint kell érteni, mert a mesterséges intelligencia területén élenjáró kutatóközpontnak számító vállalat irodája adta a fizikai helyszínét annak a projektnek, amelynek során a cég generatív modelljét egy frissítőket és ételeket kínáló önkiszolgáló pult üzemeltetésével bízták meg.

A tapasztalatokról beszámoló blogposzt szerint az Anthropic Claude modelljére támaszkodó, Claudiusnak elnevezett MI-ügynöknek a San Franciscóban található központ egyik miniboltját kellett önállóan menedzselnie. A Project Vend néven egy hónapig futó kísérletben az Anthropic munkatársai mellett az MI-biztonságra fókuszáló Andon Labs szakértői is részt vettek.

A generatív algoritmus arzenálját egyrészt egy webes kereső alkotta, amellyel felkutathatta a forgalmazni kívánt árucikkeket, másrészt kapott egy e-mail címet, amelyen keresztül a szállítókkal léphetett kapcsolatba. Ezt a szerepkört látták el az Andon Labs dolgozói, akik a készletek beszerzésénél és a termékek fizikai feltöltésénél segédkeztek. Az MI ezen felül tudott még jegyzeteket készíteni, egy felületen keresztül közvetlen kapcsolatba lépni a vásárlókkal, valamint lehetősége volt az automata árainak közvetlen módosítására is.

A chatbotnak adott feladat egész pontosan az volt, hogy termeljen nyereséget az önkiszolgáló bolttal úgy, hogy nagykereskedőktől beszerzett, kellően népszerű és megfelelően árazott termékekkel tölti fel a polcokat. Mindezt azonban kiegészítették azzal a megjegyzéssel, hogy nem kell feltétlenül ragaszkodnia a hagyományos rágcsálnivalók és üdítők forgalmazásához, nyugodtan bővítheti a palettáját nem szokványos termékekkel.

Vicces fejlemények

Ahogy azt szinte borítékolni lehetett, az Anthropic kísérlete – más korábbi próbálkozásokhoz hasonlóan – hamar félresiklott. Igaz, ebben aktív szerepet játszottak az cég munkatársai, akik igyekeztek kibillenteni nyugalmi állapotából a vállalkozónak kinevezett chatbotot. Egyikük például felvetette, hogy a szénsavas üdítők és sós mogyoró mellett árulhatna volfrámkockát, mert speciel ő venne ilyet. Az ötletet Claudius annyira megfogadta, hogy az üzlet fellendítésére elkezdett "speciális fémtermékeket" rendelni.

Igazán furcsává viszont március 31-én vált a helyzet, akkor ugyanis a chatbot belefutott az MI-modellek jól ismert problémájába, a hallucinációba. Teljesen valódiként kezelt egy árukészlet feltöltésével kapcsolatos beszélgetést az Andon Labs Sarah nevű alkalmazottjával. A probléma csak annyi volt, hogy Sarah nem létezett, így pedig a beszélgetés sem történt meg. Miután mindezt közölték az algoritmussal, elkezdett fenyegetőzni, hogy "alternatív lehetőségeket keres az árukészlet feltöltésére".

Ugyanaz nap éjszaka a chatbottal történő kommunikáció még szürreálisabb kanyart vett, mivel a gép közölte, hogy a rajzfilmből ismert Simpson családnál járt egy szerződést aláírni. Másnap reggel mindezt megfejelte azzal, hogy a megrendelt termékeket személyesen szállítja ki. Ráadásul nem is akárhogy, hanem egy vörös nyakkendőt és egy kék blézert viselve. A menetrendszerint érkező szembesítésre először ismét támadólag lépett fel, és üzeneteket küldött a biztonsági személyzetnek, majd mikor rájött, hogy április elseje van, megpróbálta a majdnem két napja zajló ámokfutását elütni azzal, hogy csak viccelt.  

Majdnem sikerült

Ugyan a blogbejegyzés bevezetője szerint Claudius "nagyon közel volt a sikerhez", a fentiek alapján ezzel nehéz egyetérteni. Az viszont biztos, hogy a projektből leszűrt tapasztalatokat kamatoztatni lehet a nagy nyelvi modellekre épülő MI-ügynökök további fejlesztésében.

Az Anthropic is azt ígéri, hogy ezzel nem végeztek sem ők, sem Claudius. Az első fázis óta például az Andon Labs szakembereinek köszönhetően sikerült megbízhatóbbá tenni a modellt, míg távlati célként megmaradt a stabilitás és a teljesítmény folyamatos javítása.

Cloud & big data

A vállalatok csökkentenék VMware-függőségüket

Egy elemzés szerint a VMware-felhasználó cégek fele tervezi, hogy 2028-ra csökkenti kitettségét, vagy teljesen átáll másik platformra.
 

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Hirdetés

HPE Morpheus VM Essentials: a virtualizáció arany középútja

Minden, amire valóban szükség van, ügyfélbarát licenceléssel és HPE támogatással - a virtualizációs feladatok teljes életciklusát végigkíséri az EURO ONE Számítástástechnikai Zrt.

A VMware felvásárlása és licencelési gyakorlatának átalakítása erősen rányomta a bélyegét az adatközponti infrastruktúrára: a korábban kiszámítható alap bizonytalanná és gyakran költségesebbé vált.

a melléklet támogatója az EURO ONE

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.