A tornászok és az egyszerű szavak is kifektetik az OpenAI Sora modelljét

Bitport2024.12.14.Konzumer tech

Rászabadultak a felhasználók a ChatGPT gyártójának szétreklámozott videógenerátorára, és hamar kiderült, hogy az a kevés mozgást és még kevesebb betűt felvonultató témákban erős.

Hirdetés

Az OpenAI néhány nappal ezelőtt tette széles körben is elérhetővé a februárban bemutatott, szöveges utasításokból rövid filmeket gyártó Sora modelljét, ráadásul az eredeti modell egy továbbfejlesztett változatának formájában, ami a társaság bejelentése alapján sokkal gyorsabban dolgozik az elődjénél. A ChatGPT Plus és a Pro csomagokra előfizető ügyfelek így nekiállhattak felfedezni az alkalmazást, leszámítva mások mellett az Európai Gazdasági Térség országaiban élőket, akiknek csak később ígérnek hozzáférést.

A Sorát az elmúlt időszakban meglehetős felhajtás övezte, azonban ahogy az MI-iparágban lassan megszokhatjuk, látatlanban sokkal kedvezőbb képet festettek róla a valóságos képességeinél. Igaz, hogy beszámolókban elismerik a modell által generált videók esetenként fotorealisztikus megjelenését, de a generatív technológiára jellemző hibákat a Sora is üzembiztosan szállítja. Felfedezték többek között, alapvető szavakat sem képes kibetűzni, egészen nevetséges dolgokat produkál, ha tornagyakorlatok megjelenítésére utasítják.

Például ilyesmit:

As cool as the new Sora is, gymnastics is still very much the Turing test for AI video.

1/4 pic.twitter.com/X78dNzusNU
— Deedy (@deedydas) December 10, 2024

Vagy ilyesmit:

The rumors are true - SORA, OpenAI's AI video generator, is launching for the public today...

I've been using it for about a week now, and have reviewed it: https://t.co/jII49vkuHN

THE BELOW VIDEO IS 100% AI GENERATED

I've learned a lot testing this, here are some new… pic.twitter.com/uA1EhRuK7B
— Marques Brownlee (@MKBHD) December 9, 2024

A felhasználók természetesen értetlenkednek, hogy az MI a látványos képességei ellenére is simán el tud hasalni az (emberi fogalmak szerint) legegyszerűbb dolgokon. Másokat ez kevésbé zavar, és csak a technológia lenyűgöző aspektusairól hajlandók értekezni, de ettől még nyilvánvaló, hogy a Sora nem annyira kifinomult, mint ahogy azt a nyilvános megjelenését megelőző kampányban sulykolták. Váratlannak persze nem nevezhető, hiszen a techvállalatok a minden bizonnyal alaposan megkonstruált imázsvideókban is rendszeresen aknákra szaladnak.

Mivel a szöveges parancsokból képeket vagy videókat gyártó modellek is tulajdonképpen a statisztikai alapú imitációról szólnak, gyakran hibáznak váratlanul és nehezen magyarázható módon. Működésükből következően minden utasításra adhatnak valamilyen kimenetet a statisztikai eloszlások vizsgálatával, de teljesen közömbösek azok igazságát illetően, az ebből fakadó korlátok és megoldatlan problémák viszont nem igazán hangsúlyosak a fejlesztők narratívájában, ami már az emberi képességeket felülmúló MI küszöbön álló megjelenéséről szól.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Konzumer tech

Hét éve próbál Excelről Google Sheetsre váltani az Airbus

A jelenleg bő 150 ezer főt foglalkoztató repülőgépgyártó óriásnál 2018-ban döntöttek arról, hogy a Microsoft csoportmunka-megoldásairól áttérnek a Google portfóliójára. Az akkor 18 hónapra becsült projekt ma is tart.

A hónap témája

Mesterséges intelligencia mint költségzabáló fekete lyuk?

Nyakunkon az árnyék MI, és valamit kezdeni kell vele. Az elszabaduló kiadások kapcsán a mindenkit érdeklő kérdés így hangzik: hasznunkra lehet a mesterséges intelligencia a költségoptimalizálásban is?

a melléklet támogatója a 4iG

Hirdetés

A "jó gazda" szemlélet menti meg az MI-költségvetést

A 4iG IT minden lehetőséget biztosít ügyfeleinek ahhoz, hogy a FinOps eszközeivel teljes körű kontrollt gyakorolhassanak IT-költéseik felett – még akkor is, ha a mesterséges intelligencia miatt új, nehezen becsülhető, dinamikusan változó költségstruktúrákat kell kezelniük.

CIO Podcast

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Hét éve próbál Excelről Google Sheetsre váltani az Airbus

Mesterséges intelligencia mint költségzabáló fekete lyuk?

CIO Podcast #65: Digitális közigazgatásból üzlet. A DÁP projekt jövője

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia