Akármilyen nagy felfordulást okozott a kínai a DeepSeek V3 modellje, ami állítólag jóval alacsonyabb költségek mellett ért el hasonló vagy még jobb teljesítményre képes az OpenAI élvonalbeli modelljeihez képest, még legalább fél tucat másik kínai MI-startuptól várhatók hasonló bejelentések – olvasható a Bloomberg riportjában. Ha ez beigazolódik, az nemcsak a nyugati technológiai piacokon okoz majd káoszt, hanem a kínai versenytársak között is újabb eszkalációhoz vezet a nagyobb teljesítményű és költséghatékonyabb mesterségesintelligencia-modellek kifejlesztéséért zajló versenyben.
A beszámolók szerint már a DeepSeek tavaly májusban bemutatott, V2-es MI-modellje is ilyen folyamatokat indított be, amit nyílt forrású és példátlanul olcsó megoldásként másokat is jelentős árcsökkentésre kényszerített volt: az Alibaba cloud egységénél ez esetenként akár a 97 százalékot is elérhette, amit a Baidu, a Tencent és mások is követtek. A helyzet pedig keleten is tovább fokozódik: miután a DeepSeek legújabb termékeinek megjelenése több mint 1 billió dollárral csökkent az ágazathoz sorolt nagyvállalatok piaci kapitalizációja, a ByteDance és az Alibaba is rögtön rátromfolt a DeepSeek alkalmazására.
Bár mindkét gyártó azt állítja, hogy a DeepSeekhez hasonlóan bizonyos "mérvadó mainstream benchmarkok" esetében túlhaladta az OpenAI o1 modelljét, az Alibaba Qwen 2.5-Max összességében a DeepSeek V3-nál is többet ígér. Emellett a vállalat nyilatkozata szerint "teljes egészében felülmúlja" az OpenAI GPT-4o, az Anthropic Claude 3.5 Sonnet vagy a Meta Llama 3.1 modelleket is, így nem meglepő, hogy a DeepSeeknél jóval több erőforrással rendelkező Alibaba ringbe szállása újabb lökéshullámokat indított el a piacon: még a csipgyártó Nvidia részvényárfolyama is újra megdöccent a bejelentést követően.
Minden tekintetben nyílt forrású
A fejetlenséget az is jól jellemzi, hogy milyen technológiák vadítják meg napról napra a befektetőket: a Wiz cloud biztonsági szolgáltató kutatói néhány nappal ezelőtt tették közzé, milyen egyszerűen voltak képesek hozzáférni egy sor teljesen titkosítatlan belső adathoz a DeepSeek adatbázisában, köztük jelentős mennyiségű csevegési előzménnyel, log streamekkel és más érzékeny információkkal. A társasággal ráadásul olyan nehéz volt felvenniük a kapcsolatot, hogy végül már LinkedIn-üzenetekkel próbálkoztak; a Wired tudósítása szerint a DeepSeek ezekre sem reagált, de egy órán belül lezárta az adatbázist.
Ahogy a Wiz kutatási vezetője elmondta, ilyen expozíciókat általában akkor találnak, amikor valamilyen elhanyagolt szolgáltatást vizsgálnak, de még ott sem "közvetlenül a bejárati ajtónál". Ha korábban másnak is sikerült ilyen módon behatolnia a DeepSeek adatbázisaiba, akkor az a Wiz szerint minimális erőfeszítéssel annyi belső adatot tudott volna megszerezni, amennyit csak akar. Ennek alapján pedig egyértelműnek tartják, hogy a DeepSeek szolgáltatásai egyszerűen nem elég érettek hozzá, hogy érzékeny adatokkal is használhatók legyenek, de a jelek szerint az MI-őrület csúcsán ez a fajta kompetencia nem feltétele a sikernek.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak