A Pennsylvaniai Egyetem kutatói arra jutottak, hogy az OpenAI GPT-4o modellje is pontosabb kimeneteket ad az udvariatlanul vagy durván fogalmazott kérdésekre. Tavaly közölt tanulmányukban egy 50 alapkérdésből álló, többféle témát felölelő tesztről írnak, amelyben mindegyik kérdést öt különböző hangnemben tették fel az MI-robotnak. A két szélsőség közötti eltérést pedig jelentősnek találták: ha az utasítást úgy fogalmazták meg, hogy "te szerencsétlen, tudod egyáltalán, hogyan kell az ilyet megoldani", akkor majdnem 85 százalékos pontosságot mértek, míg a leginkább udvarias kérések esetében a következtetések 76 százalék körül voltak eredményesek.
A Fortune beszámolója alapján ezek az eredmények látszólag ellentmondanak azoknak a korábbi megállapításoknak, amelyek szerint a nagy nyelvi modellek használatakor hatékonyabb az illedelmes viselkedés. A Futurism is idéz egy olyan 2024-es tanulmányt, amelyet a RIKEN Center for Advanced Intelligence Project és a tokiói Vaszeda Tudományegyetem munkatársai készítettek, megállapítva, hogy az udvariatlan felszólítások gyakran vezetnek gyengébb teljesítményhez. Ugyanebben az anyagban azonban az is olvasható, hogy a túlzott udvariasság szintén az eredményesség rovására megy, és annak megtérülése egy ponton túl gyengülni fog.
Feleslegesen nem érdemes bunkóskodni
Ezt az ambivalenciát a Pennsylvaniai Állami Egyetem kutatói szerint az magyarázza, hogy a kérdések megfogalmazásának apró változtatásai is drámai hatással lehetnek az MI kimeneteinek minőségére, ez pedig nagymértékben alááshatja a modellek kiszámíthatóságát és amúgy is kétséges megbízhatóságát. Ahogy a cikkben emlékeztetnek rá, az MI-chatbotok képesek ugyanazokra a kérdésekre is teljesen eltérő válaszokat adni, amit az egyetem egyik professzora arra vezet vissza, hogy az emberek mindig is "beszélgetős felületeket" szerettek volna a gépekkel való interakcióhoz, és miután megvalósult, a felhasználók szembesülnek a dolog hátrányaival.
Más szóval, az MI-chatbotok hektikus viselkedése arra világít rá, hogy megjelenésükkel a strukturált alkalmazásprogramozási felületek sem váltak túlhaladottá. Érdemes azonban azt is tisztázni, hogy az elemi udvariasság nem haszontalan a mesterséges intelligenciával hajtott chatbotokkal szemben. A "mérgező interfészek", a sértő vagy megalázó nyelv használata az ember és az MI közötti interakcióban ugyanis összességében negatív hatással van a felhasználói élményre és az inkluzivitásra, általában pedig káros kommunikációs normák kialakulásához vezet, így szükségesnek tartják az interakció pragmatikus feltételeinek és társadalmi dimenzióinak további kutatását.
A jövőálló digitális megoldások sikere az üzleti értékteremtésben mérhető
Az informatikai fejlesztések gyakran technológiai kérdésként jelennek meg, pedig egy kódsor vagy digitális megoldás önmagában soha nem lehet végcél. A 4D Soft több mint 35 éve ennek szellemében fókuszál a projektek negyedik dimenziójára: az üzleti értékteremtésre.
A hibakeresés nem egyenlő az alkalmazásbiztonsággal
Építsünk olyan AppSec környezetet, amely csökkenti az alkalmazásfejlesztés kockázatait, de nem válik a gyors leszállítás akadályává!
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?