Frissen bemutatott modelljükkel már tényleg majdnem úgy lehet beszélgetni, mint egy valódi emberrel. Ráadásul a technológiát mindenki számára ingyen elérhetővé teszik.

Magyar idő szerint tegnap este kiderült, mi is az új dobása a ChatGPT elérhetővé tételével a köztudatba másfél éve berobbant OpenAI-nak. A generatív mesterséges intelligencia területén meghatározó cég a pletykákkal ellentétben sem Google-verő(nek szánt) keresőt, sem a GPT ötödik generációját nem mutatta be.

Érkezik viszont a GPT-4o névre keresztelt új modell, amely az elérhető demók alapján teljesen új szintre emeli a digitális asszisztensek világát. Az OpenAI technológiája egy minden lehetséges beviteli formátumra kiterjedő, egységes MI, amely ennek köszönhetően villámgyorsan, értelmesen és hihető módon tud reagálni, legyen szó szövegről, hangról vagy éppen (mozgó)képről.

Az alábbi videóban a cég munkatársai több példát hozva járják körül az új modell képességeit. A GPT-4o többek között matektanárként, fordítóként és kódelemzőként is megállja a helyét, de a legmegdöbbentőbb az, ahogy és amilyen természetesnek ható módon reagál váratlan helyzetekre.
 

 

A GPT-4o a generatív algoritmusok képességeinek felmérésére használt mérőszámok legtöbbjében meggyőzően veri mind a házon belüli, mind a házon kívüli konkurenciát. Gyorsaságát és széles repertoárját pedig a tervek szerint mindenki megtapasztalhatja.

A szakaszos bevezetés első fázisában a szöveges és képi funkciók azonnal beépülnek a ChatGPT-be. Fontos hangsúlyozni, hogy ez ugyanúgy igaz az ingyenes és a fizetős változatra. Utóbbi előnye abban áll, hogy a Pro-felhasználók naponta több lekérdezést indíthatnak, plusz heteken belül itt fog debütálni alfa verzióban a GPT-4o hangalapú funkcionalitása.

Az OpenAI modelljeire építő fejlesztők API-n keresztül máris elérhetik a szöveges és képi technológiát. A cég közlése szerint a GPT-4o kétszer gyorsabb, feleannyiba kerül, és a GPT-4 Turbóhoz képest ötször magasabb sebességhatárokkal rendelkezik. A hang- és videofunkciók bevezetése elsőként csak egy kiválasztott fejlesztői körre szorítkozik majd, amit a későbbiekben terveznek megnyitni a nagyközönség előtt.

Az pedig szinte már csak hab a tortán, hogy a GPT-4o beépítésével az ingyenes ChatGPT egy sor, korábban fizető fal mögé zárt funkcióval gazdagodik. Ilyen például az elemzések és grafikonok használata, a dokumentumok feltöltésének a lehetősége, vagy éppen az általunk készített fotókkal kapcsolatos ember-gép kommunikáció.

Szinte tökéletes

A rövid filmeket kreáló Sora februári debütálása után alig néhány hónappal az OpenAI mérnökeinek sikerült újra elképeszteni a világot a GPT-4o tudásával. A természetes emberi hangsúlyokkal, apró részletekkel (például teátrális sóhajtás) operáló algoritmus egészen lenyűgöző beszélgetésekre képes.

Ugyan lényegesen kevesebb helyen és finomabb formában, mint a Sora alkotásainál, de azért a GPT-4o esetében is kiszúrhatók még bakik. Az egyik feladat során például érzelmeket kellett leolvasnia egy arcról kamerakép alapján, ám az a bekapcsoláskor egy pillanatra az asztalt mutatta. Az algoritmus így először bizonytalanul megjegyezte, hogy egy fának tűnő felszínt lát. Az ilyen időzítésból fakadó problémákat egy valódi ember gond nélkül felismeri, és nem próbálja meg elemezni az asztallap érzelmeit.

Azt pedig csak remélni lehet, hogy a GPT-4o demóinak egyikéről sem derül ki utólag, hogy külső segítséggel, megkomponálva készült. Mint ahogy az történt egy interneten felkapott Sora-anyaggal, aminek kapcsán az OpenAI elfelejtette feltűntetni, hogy nem kizárólag az MI munkáját dícséri a kisfilm.

(Kép: OpenAI)

Cloud & big data

Sztrájkba kezdenek a videójátékok szinkronszínészei az MI miatt

A hollywoodi színészek és a játékkészítő stúdiók képviselői közel álltak a megállapodáshoz, ám a generatív algoritmusok jelentette problémákat egyelőre nem sikerült megnyugtatóan rendezni.
 
Általános jelenség a hazai nagyvállalatok körében, hogy a szükségesnél jelentősen többet költenek nyilvánosfelhő-szolgáltatásokra. Utánajártunk, mi a pontos helyzet, és mit lehet tenni a költségek optimalizálásáért.

a melléklet támogatója a 4iG Nyrt.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.