A nemrég kiadott Strawberry modellről korábban úgy beszéltek, mint egy újabb lépésről a mesterséges általános intelligencia (AGI) megalkotása felé, de az első tapasztalatok alapján a technológiára jellemző hiányosságokat is tovább görgeti maga előtt.

Az OpenAI csütörtökön adta ki Strawberry néven hivatkozott MI-modelljét, ami az új nevezéktanban "OpenAI o1-preview" néven jelenik meg, és a vállalat ígéretei szerint a PhD hallgatókhoz hasonló teljesítményre képes a fizikai, kémiai és biológia benchmark feladatokban. A modell a bejelentés alapján már emberszerű következtetési képességekkel rendelkezik, és a korábbi kiadásokhoz képest sokkal összetettebb problémákkal is sikeresen megbirkózik a tudományos területeken, a matematikai feladványokban vagy a programkódok felépítésében.

Ahogy azonban a korai tesztelők első beszámolóiból kiderül, az emberi tudósoknak és programozóknak egyelőre nem kell aggódniuk. A Strawberry a költségeit és az erőforrásigényét tekintve valóban felsőbb szintre lépett, azonban a kimeneteiben sokszor bonyolítja túl az érvelést, és hajlamos rá, hogy a megszokott módon leolvadjon a legegyszerűbb kérdésektől. Bár azt a gyártó is elismeri, hogy a modell még fejlesztés alatt áll, és sok feladatra továbbra is a GPT-4o lesz az alkalmasabb eszköz, az emberi értelemmel mindenképpen korai volt összehasonlítani.

Nem a teljesítmény, hanem a felhajtás problémás

A Futourism összeállítása szemléletes példákat hoz azokból a kísérletekből, amelyeket a felhasználók eddig közzétettek. A Strawberry egyes esetekben továbbra is szabálytalan lépésekkel próbálja megoldani a sakkfeladványokat, reménytelenül belegabalyodik a primitív szöveges feladatokba, időnként pedig az is kifog rajta, ha megkérdezik tőle, hogy hány darab R betű van a strawberry (magyarul eper) szóban. Ezek a nagy nyelvi modellekre eddig is jellemző hibákat idézik, vagyis a jelek szerint ezúttal sem jutottak sokkal közelebb azok kiküszöböléséhez.

Az OpenAI szerint a legújabb MI "korai modellként" még nem feltétlenül rendelkezik a ChatGPT-t hasznossá tevő funkciókkal, és iteratív megoldásainak kidolgozása is hosszabb válaszidőt eredményez. A lap a vállalat egyik kutatóját idézi, aki szerint a drágább és lassabb működés azonban vállalható kompromisszum, ha az eredmény egy új rákgyógyszer vagy a Riemann-sejtés bizonyítása, a kritikusok szerint azonban nem jó ötlet ilyen elvárásokat támasztani az új modellel szemben, ami még egy amőbapartit sem képes megbízhatóan lehozni.

Cloud & big data

Harry Smithnek hívnak? Akkor buktad ezt a szoftvermérnöki állást!

A mesterséges intelligenciát használó toborzószoftverek állítólag nem szeretik az angolszász nevet viselő férfi jelölteket.
 
Ezt már akkor sokan állították, amikor a Watson vagy a DeepMind még legfeljebb érdekes játék volt, mert jó volt kvízben, sakkban vagy góban.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.