A Gemini 2.0 bizonyos képességei azonnal, mások fokozatosan válnak elérhetővé a felhasználók számára.

Úgy tűnik, egyetlen mesterséges intelligencia fejlesztésében érintett cégnél sem akarnak úgy elmenni karácsonyozni, hogy az év zárásaként ne jelentenének be valami jelentőset. Az OpenAI múlt héten az új o1 modelljét, a hét elején pedig a Sora videógenerátort tette elérhetővé, miközben az Elon Musk nevével fémjelzett xAI a techmilliárdos által irányított X közösségi platform összes felhasználója előtt megnyitotta a Grok generatív algoritmus és az abba beépülő Aurora képgenerátor használatát.

Tegnap a Google is beállt a sorba, és bemutatta a Gemini második generációját és a fejlettebb MI-modellre alapozott, közeljövőben megvalósítandó terveit. A cég erről szóló blogbejegyzése szerint a Gemini 2.0 természetesen a Google eddigi legszofisztikáltabb modellje. A multimodális algoritmus a szöveges kommunikáció mellett utasítható élő szóban, illetve vizuális imputokat is képes feldolgozni.
 


Az új generáció képességeinek első szeletét a Gemini 2.0 Flash előzetes módjával lehet kipróbálni akár már most is a Gemini AI Studio webes változatában (mobilra hamarosan érkezik). Az "igásló modellként" beharangozott változat támogatja a kép- és hanggenerálást, integráltan használja a cég keresőjét, kódol, matematikai feladatokat old meg és együttműködik harmadik féltől származó alkalmazásokkal.

Legfontosabb újdonsága, hogy – az ígéretek szerint – a korábbinál sokkal összetettebb feladatok elvégzésére is alkalmas, azaz sokkal inkább használható lesz olyasmire, amit általában egy asszisztens szokott megoldani. A fenti videóban például a gép a tervezéstől a webes bevásárlásig végigvisz egy többlépcsős folyamatot, amit a végén a felhasználónak csak le kell okéznia.

A Gemini második generációja újabb lépést jelent a cég tavasszal bemutatott grandiózus tervének elérésében. A Project Astra egy valós időben reagáló, multimodális asszisztens, amiből a fejlesztéséért felelős DeepMind a felhasználók mindennapi feladatait támogató univerzális alkalmazást faragna. Az Astra legújabb verziója a fejlesztéseknek köszönhetően például úgy képes több nyelven kommunikálni, hogy gond nélkül váltogat közöttük menet közben, de javult a reakciója és a "memóriája" is, illetve felkerült arzenáljába a Google Lens és a Maps.

A puding próbája

A vállalat bemutatója alapján a generatív algoritmus remekül alkalmazható videójátékos segédként is, aki mintegy a kanapé szélén ülve osztja a tanácsokat, pusztán az éppen a képernyőn látható információkra és a netre támaszkodva. Apró probléma, hogy a minden bizonnyal alaposan megkonstruált, többször leellenőrzött céges videóban is képes tényszerűen rossz tanáccsal szolgálni az MI, ami némi sötét árnyékot vetít az egész 2.0-s bejelentésre.

Annak fényében pedig különösen óvatosan kell kezelni a hivatalos állításokat, hogy a Google már korábban is ráfutott hasonló aknákra. A ChatGPT megjelenése miatt kapkodva kiadott Bard reklámvideójában például szintén olyasmit állított a roppant fejlettnek beharangozott chatbotjuk, ami köszönőviszonyban sem volt a valósággal.

Cloud & big data

Már az emberek álmaiba is beszivárgott a mesterséges intelligencia

Tudtuk, hogy az MI az élet minden területén megjelenik, de így is elég vadul hangzik, ami az Amerisleep márciusi felmérésében olvasható.
 
Körképünkben áttekintjük, hogy szűkebb és bővebb környezetünkben mit sikerült elérni a digitális gazdaság és életvitel felé vezető úton. Spolier: nem állunk olyan rosszul, mint gondolná, és nem állunk olyan jól, mint szeretné.

a melléklet támogatója a One Solutions

CIO KUTATÁS

AZ IRÁNYÍTÁS VISSZASZERZÉSE

Valóban egyre nagyobb lehet az IT és az IT-vezető súlya a vállalatokon belül? A nemzetközi mérések szerint igen, de mi a helyzet Magyarországon?

Segítsen megtalálni a választ! Töltse ki a Budapesti Corvinus Egyetem és a Bitport anonim kutatását, és kérje meg erre üzleti oldalon dolgozó vezetőtársait is!

Az eredményeket május 8-9-én ismertetjük a 16. CIO Hungary konferencián.

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2025 Bitport.hu Média Kft. Minden jog fenntartva.