Az OpenAI május közepén villantotta fel, mire képes legújabb generatív modellje. A multimodális, azaz szövegesen, hanggal és (mozgó)képpel is utasítható GPT-4o-nak keresztelt változatot a cég szakaszosan vezeti be: a szöveges és képi funkciók azonnal beépültek a ChatGPT ingyenes és fizetős változatába is. A Pro-felhasználóknak pedig azt ígérték, hogy számukra heteken belül elérhetővé válik a GPT-4o hangalapú funkcionalitása.
Ez utóbbi a jelek szerint nem fog összejönni, mert a cég tegnap X-en jelentette be, hogy több időre lesz szükség ahhoz, hogy az úgynevezett fejlett hangmód nagyobb közönség előtt debütálhasson. Az OpenAI jelenleg azzal számol, hogy egy hónap múlva kezdődhet meg felhasználók egy kis csoportjával a tesztfázis, amelyet a remények szerint az őszi teljes bevezetés követhet.
Az extra időt a vállalat többek között arra használja, hogy a modell pontosabban ismerjen fel bizonyos (elutasítandó) tartalmakat. Valamint tovább javítanák a felhasználói élményt, miközben az infrastruktúrát is felkészítik a borítékolhatóan nagy érdkelődésre.
A májusi bemutatón szintén felvillantott videós és képernyőmegosztós funkciókkal kapcsolatban most csak annyit közölt a cég, hogy dolgoznak ezek bevezetésén is, de a pontos ütemtervvel majd csak később jelentkeznek.
Hangos probléma
Ugyan a ChatGPT már tavaly is képes volt hangalapú visszajelzésre, a GPT-4o-ba szánt változat képességei egy teljesen új szintet képviselnek. A természetes emberi hangsúlyokkal, apró részletekkel (például teátrális sóhajtás) operáló algoritmus egészen lenyűgöző beszélgetéseket folytatott a májusi élő demóban.
Nem feltétlenül van köze a halasztáshoz, de mindenképpen kellemetlen mellékszál a történetben, hogy a tavaszi bemutatót követően Scarlett Johanson színésznő azzal vádolta meg a céget, hogy a GPT-4o öt hangos "személyisége" közül az egyik az ő hangja alapján készült. És bár a vállalat kategorikusan tagadta a vádakat és félreértésről beszél, a szövevényes történetben sok furcsa elem bukkant fel.
Bezár a kínai kiskapu
A fentiektől teljesen független, ám az OpenAI-hoz kötődő heti hír, hogy a cég eltökélte magát arra, hogy blokkolja termékei hozzáférését a kínai felhasználók esetében. Ugyan a távol-keleti nagyhatalom eddgi sem szerepelt a vállalat bő 160 országra kiterjedő támogatási listáján, ám eddig az OpenAI kvázi eltűrte, hogy API-n keresztül a nem támogatott területekről is használják a ChatGPT-t. A cég szóvivője ezzel kapcsolatban a Reutersnek nyilatkozva elmondta, hogy további lépéseket tesznek annak érdekében, hogy blokkolják az API-forgalmat azokból a régiókból, ahol vállalat "nem támogatja az OpenAI szolgáltatásaihoz való hozzáférést".
A lépés összevág azzal az amerikai kormányzati szándékkal, hogy Kínát minél jobban elvágják a fejlett nyugati technológiáktól, egyúttal viszont lehetőséget is ad a kínai MI-cégeknek arra, hogy a ChatGPT nélkül maradó felhasználókat saját táborukba csábítsák.
CIO KUTATÁS
AZ IRÁNYÍTÁS VISSZASZERZÉSE
Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?
Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!
Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak