Az OpenAI megint valami durvát húzott elő a kalapból

Bitport2024.05.14.Cloud & big data

Frissen bemutatott modelljükkel már tényleg majdnem úgy lehet beszélgetni, mint egy valódi emberrel. Ráadásul a technológiát mindenki számára ingyen elérhetővé teszik.

Magyar idő szerint tegnap este kiderült, mi is az új dobása a ChatGPT elérhetővé tételével a köztudatba másfél éve berobbant OpenAI-nak. A generatív mesterséges intelligencia területén meghatározó cég a pletykákkal ellentétben sem Google-verő(nek szánt) keresőt, sem a GPT ötödik generációját nem mutatta be.

Érkezik viszont a GPT-4o névre keresztelt új modell, amely az elérhető demók alapján teljesen új szintre emeli a digitális asszisztensek világát. Az OpenAI technológiája egy minden lehetséges beviteli formátumra kiterjedő, egységes MI, amely ennek köszönhetően villámgyorsan, értelmesen és hihető módon tud reagálni, legyen szó szövegről, hangról vagy éppen (mozgó)képről.

Az alábbi videóban a cég munkatársai több példát hozva járják körül az új modell képességeit. A GPT-4o többek között matektanárként, fordítóként és kódelemzőként is megállja a helyét, de a legmegdöbbentőbb az, ahogy és amilyen természetesnek ható módon reagál váratlan helyzetekre.

A GPT-4o a generatív algoritmusok képességeinek felmérésére használt mérőszámok legtöbbjében meggyőzően veri mind a házon belüli, mind a házon kívüli konkurenciát. Gyorsaságát és széles repertoárját pedig a tervek szerint mindenki megtapasztalhatja.

A szakaszos bevezetés első fázisában a szöveges és képi funkciók azonnal beépülnek a ChatGPT-be. Fontos hangsúlyozni, hogy ez ugyanúgy igaz az ingyenes és a fizetős változatra. Utóbbi előnye abban áll, hogy a Pro-felhasználók naponta több lekérdezést indíthatnak, plusz heteken belül itt fog debütálni alfa verzióban a GPT-4o hangalapú funkcionalitása.

Az OpenAI modelljeire építő fejlesztők API-n keresztül máris elérhetik a szöveges és képi technológiát. A cég közlése szerint a GPT-4o kétszer gyorsabb, feleannyiba kerül, és a GPT-4 Turbóhoz képest ötször magasabb sebességhatárokkal rendelkezik. A hang- és videofunkciók bevezetése elsőként csak egy kiválasztott fejlesztői körre szorítkozik majd, amit a későbbiekben terveznek megnyitni a nagyközönség előtt.

Az pedig szinte már csak hab a tortán, hogy a GPT-4o beépítésével az ingyenes ChatGPT egy sor, korábban fizető fal mögé zárt funkcióval gazdagodik. Ilyen például az elemzések és grafikonok használata, a dokumentumok feltöltésének a lehetősége, vagy éppen az általunk készített fotókkal kapcsolatos ember-gép kommunikáció.

Szinte tökéletes

A rövid filmeket kreáló Sora februári debütálása után alig néhány hónappal az OpenAI mérnökeinek sikerült újra elképeszteni a világot a GPT-4o tudásával. A természetes emberi hangsúlyokkal, apró részletekkel (például teátrális sóhajtás) operáló algoritmus egészen lenyűgöző beszélgetésekre képes.

Ugyan lényegesen kevesebb helyen és finomabb formában, mint a Sora alkotásainál, de azért a GPT-4o esetében is kiszúrhatók még bakik. Az egyik feladat során például érzelmeket kellett leolvasnia egy arcról kamerakép alapján, ám az a bekapcsoláskor egy pillanatra az asztalt mutatta. Az algoritmus így először bizonytalanul megjegyezte, hogy egy fának tűnő felszínt lát. Az ilyen időzítésból fakadó problémákat egy valódi ember gond nélkül felismeri, és nem próbálja meg elemezni az asztallap érzelmeit.

Azt pedig csak remélni lehet, hogy a GPT-4o demóinak egyikéről sem derül ki utólag, hogy külső segítséggel, megkomponálva készült. Mint ahogy az történt egy interneten felkapott Sora-anyaggal, aminek kapcsán az OpenAI elfelejtette feltűntetni, hogy nem kizárólag az MI munkáját dícséri a kisfilm.

_{(Kép: OpenAI)}

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Hamarosan jóval drágább lesz a digitális életünk

Áremelésre készülnek a szerver- és PC-gyártók, és áremelésre készül a Microsoft is. Mindenkinek megvan a nyomós érve, hogy miért.

A hónap témája

Hogyan lett a riportolásból döntésautomatizálás?

Az üzleti intelligencia sokáig a múltban történtek értékelésről szólt. Napjainkban viszont már inkább az a kérdés, hogy mi történik holnap; különösen akkor, ha módosítjuk a vállalati működés valamelyik paraméterét.

a melléklet támogatója a One Solutions

CIO Podcast

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

CIO Podcast #66: A DÁP projekt és a piac. A szembesítés félórája

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hamarosan jóval drágább lesz a digitális életünk

Hogyan lett a riportolásból döntésautomatizálás?

Podcast: Miért kell négy céget nyolc részre vágni, hogy kettőt csináljunk belőlük?

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia