A nemrég kiadott Strawberry modellről korábban úgy beszéltek, mint egy újabb lépésről a mesterséges általános intelligencia (AGI) megalkotása felé, de az első tapasztalatok alapján a technológiára jellemző hiányosságokat is tovább görgeti maga előtt.

Az OpenAI csütörtökön adta ki Strawberry néven hivatkozott MI-modelljét, ami az új nevezéktanban "OpenAI o1-preview" néven jelenik meg, és a vállalat ígéretei szerint a PhD hallgatókhoz hasonló teljesítményre képes a fizikai, kémiai és biológia benchmark feladatokban. A modell a bejelentés alapján már emberszerű következtetési képességekkel rendelkezik, és a korábbi kiadásokhoz képest sokkal összetettebb problémákkal is sikeresen megbirkózik a tudományos területeken, a matematikai feladványokban vagy a programkódok felépítésében.

Ahogy azonban a korai tesztelők első beszámolóiból kiderül, az emberi tudósoknak és programozóknak egyelőre nem kell aggódniuk. A Strawberry a költségeit és az erőforrásigényét tekintve valóban felsőbb szintre lépett, azonban a kimeneteiben sokszor bonyolítja túl az érvelést, és hajlamos rá, hogy a megszokott módon leolvadjon a legegyszerűbb kérdésektől. Bár azt a gyártó is elismeri, hogy a modell még fejlesztés alatt áll, és sok feladatra továbbra is a GPT-4o lesz az alkalmasabb eszköz, az emberi értelemmel mindenképpen korai volt összehasonlítani.

Nem a teljesítmény, hanem a felhajtás problémás

A Futourism összeállítása szemléletes példákat hoz azokból a kísérletekből, amelyeket a felhasználók eddig közzétettek. A Strawberry egyes esetekben továbbra is szabálytalan lépésekkel próbálja megoldani a sakkfeladványokat, reménytelenül belegabalyodik a primitív szöveges feladatokba, időnként pedig az is kifog rajta, ha megkérdezik tőle, hogy hány darab R betű van a strawberry (magyarul eper) szóban. Ezek a nagy nyelvi modellekre eddig is jellemző hibákat idézik, vagyis a jelek szerint ezúttal sem jutottak sokkal közelebb azok kiküszöböléséhez.

Az OpenAI szerint a legújabb MI "korai modellként" még nem feltétlenül rendelkezik a ChatGPT-t hasznossá tevő funkciókkal, és iteratív megoldásainak kidolgozása is hosszabb válaszidőt eredményez. A lap a vállalat egyik kutatóját idézi, aki szerint a drágább és lassabb működés azonban vállalható kompromisszum, ha az eredmény egy új rákgyógyszer vagy a Riemann-sejtés bizonyítása, a kritikusok szerint azonban nem jó ötlet ilyen elvárásokat támasztani az új modellel szemben, ami még egy amőbapartit sem képes megbízhatóan lehozni.

Cloud & big data

Működőképes-e a magyar MI-stratégia?

Az IVSZ is véleményezte a Nagy Márton és Palkovics László jegyezte stratégiát.
 
Hirdetés

A kifizetett energia
60%-a elvész, de egy audit feltárja, hol folyik el a pénzünk

A Schneider Electric energiahatékonysági szolgáltatása átfogó megoldást kínál, amely támogatja a cégek energiahatékonyság-növelési programjaik megvalósításában, az iparágban vezető megoldások, szolgáltatások és szakértők segítségével.

A vállalati IT-rendszerek egyik legnagyobb kihívása ma már nem a hardver beszerzése vagy a szoftverek integrációja, hanem az üzemeltetés. A modern storage-megoldások válasza erre az automatizáció és a menedzsment egyszerűsítése.

a melléklet támogatója az EURO ONE

Hirdetés

Hatékony adattárolás, biztonságosabb működés: HPE storage az EURO ONE szakértelmével

Az adatmennyiség rohamos növekedése, a kritikus üzleti alkalmazások rendelkezésre állási követelményei és a kiberbiztonsági fenyegetések mind olyan tényezők, amelyek túlmutatnak a hagyományos storage-megoldások képességein.

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.