A Databricks tulajdonába kerül a MosaicML: mindez potom 1,3 milliárd dollárért. A TechCrunch a felvásárlás kapcsán nagy M&A-hullámot vizionál.
A Databricks, amelyet a kaliforniai Berkeley Egyetem oktatói és kutatói alapítottak, eredetileg ún. zero-management igényű adatelemzési felhős platform fejlesztésével foglalkozott, és technológiáit az IBM is felhasználta. A 2021 elején indult MosaicML (a fenti képen a két alapító, balra Naveen Rao és Hanlin Tang) pedig nyílt forráskódra alapozva fejleszt olyan platformokat különböző szervezeteknek, melyek ún. nagy nyelvi modellek (large language model, LLM) képzésére és azokon alapuló generatív MI-eszközök bevezetésére alkalmasak.
Az biztos, hogy a startup finanszírozói nagyon jó üzletet csináltak, ugyanis két év sem kellett ahhoz, hogy százmilliókat kaszáljanak filléres befektetéssel. A "filléres" persze képletesen értendő: a MosaicML eddig 64 millió dollárt szedett össze, de az utolsó befektetési körben is csak 222 millió dollárra értékelték.
Az MI demokratizálói lennének
A Databricksnek viszont hatszor ennyit is megért, mert tudta, hogy miért van szüksége a MosaicML technológiáira. A felvásárolt csapat a Lakehouse Platform részeként dolgozik tovább, és generatív MI-eszközöket biztosít a Databricks többfelhős adatelemzési megoldásaihoz, olvasható a tranzakcióról kiadott közleményben. A TechCrunch szerint valószínűleg annak is köszönhető a magas vételár, hogy marad a teljes MosaicML-csapat. Ez egyébként nem jelent drámai létszámnövekedést a felvásárlónál, mivel több mint 4000 alkalmazottja van, míg a MosaicML-nél hetvennél is kevesebben dolgoznak.
A MosaicML megközelítése is fontos szempont lehetett: nyílt forráskódra épít, és olyan szervezetekre fókuszál, melyek saját adataikra alapozva akarnak saját LLM-et építeni. Úgy tűnik, életképes ez a megközelítés, mert több szektorból is sikerült ügyfeleket szerezniük, igaz, főleg startupokat: az Allen Institute for AI mellett ügyfelük például az általános MI-t kutató-fejlesztő Generally Intelligent, az egészségügyi MI-ben utazó Hippocratic AI vagy az integrált fejlesztői környezetet SaaS-modellben kínáló Replit.
Szakértők szerint az egyesülés mindkét vállalatnak előnyös. A Databricks az adatkezelést és -elemzést végző eszközeihez MI-t, a MosaicML pedig jó adatokat kap a modellépítéshez, meg persze sok potenciális ügyfelet. A Databricks alapplatformja segít a különböző forrásokból származó adatok rugalmas tárolásában és rendszerezésében, míg a MosaicML elérhető árú eszközöket biztosít, hogy az adatokat fel lehessen használni egyéni speciális MI-modellek építésére, ami a két vállalat értelmezésében az MI demokratizálásával ér fel.
A nyílt forráskód előnye
Mint a The Register felhívja a figyelmet, sok szervezet ódzkodik attól, hogy potenciális versenytársakkal osszon meg érzékeny információkat, ráadásul olyan modellekkel kellene dolgozniuk, aminek működését, viselkedését nem látják át. Bár voltak ígéretek a nagy modellek kódjának részleges megnyitására, ezekből egyelőre semmi sem valósult meg, és azt sem lehet tudni, hogy például az OpenAI vagy a Google pontosan milyen adatokat használ modelljei tanításához. Ez az üzleti felhasználókat elbizonytalaníthatja, hiszen nehezen megjósolható, hogy adott algoritmus hogyan fog működni, eredményei mennyire megbízhatóak. A Databricks és a MosaicML viszont olyan konstrukciót tud kínálni az MI-t alkalmazó szervezeteknek, amelyben megkapják a lehetőséget mind az adatok, mind a modell kontrolljára.
A másik nagy ígéret a viszonylagos olcsóság. A MosaicML szerint két nyílt forráskódú LLM-jével, az MPT-7B-vel és az MPT-30B-vel (utóbbi állítólag erősebb, mint a GPT-3) pár százezer dollárból építhető egy saját modell, szemben más rendszerek több millió dolláros költségeivel. Kétségtelen, hogy sokkal korlátozottabb lesz a képességük, mint mondjuk egy GPT-4-é, de a vállalatok többsége olyan MI-t keres, aminek megalkotása nem viszi el a teljes fejlesztési büdzsét, ellenben nagy biztonsággal megold bizonyos célfeladatokat.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak