Bizonyos vállalati kör még jó ideig nem fogja kitenni minden adatát a felhőbe. Ha még a bizalmatlanság csökken is a felhős tárolás biztonságával szemben, bizonyos megfelelőségi előírások még évekig erre kényszerítik az érzékeny adatokat tároló szervezeteket, különösen azokat, melyek a kritikus infrastruktúra részei. Egyre több olyan hang van, amely magukat a felhőszolgáltatókat is a kritikus infrastruktúrák körébe sorolná. Ha ez globálisan elfogadottá válik, és a felhőszolgáltatók működését is ilyen szellemben szabályoznák, az nagymértékben növelné a felhasználók bizalmát is.
Nem lesz megkerülhető
De bárhogy is vélekedjenek a szervezetek a felhőről, az adatok rohamos növekedése és az egyre általánosabb elemzési igény miatt nem lehet lemondani a felhős adattárolásról. A Cisco egyik – talán merésznek hangzó – előrejelzése szerint már 2021-ben az összes digitális adat 94 százaléka a felhőben lesz. A Gartner pedig már az idei évre azt jósolta, hogy globálisan a szervezetek az új szoftverek beszerzésére fordítható büdzséjük több mint 30 százalékát tisztán felhős szolgáltatásokra költik.
Mindazonáltal még marad a hibrid modell: saját adatközpontok házon belüli felhős szolgáltatásra építve, amihez publikus felhőből vesznek igénybe kapacitást, ha átmenetileg nő a terhelésigény. Ez a terheléselosztás optimalizálása és a kockázat minimalizálása szempontjából jó megoldás, de a a folyamatokat és az üzemeltetést mindenképpen bonyolultabbá teszi.
Van azonban a felhős adattárolásnak egy olyan új iránya, amely – legalábbis ígéretében – egyszerre nyújtja a maximális biztonságot és a felhő kínálta rugalmasságot: a blockchain-alapú, elosztott felhős adattárolás. Ebben lényegében egy blockchainen alapuló peer-to-peer hálózat garantálja az adatok biztonságos hálózatát és az adatbiztonságot.
A fölösleges kapacitásokat is hasznosítja
Az elosztott felhőalapú tárolási platformok alapkoncepciója az, hogy egy blockchain-alapú rendszerben összekapcsolják az úgynevezett hostokat, melyektől kriptovalutáért vagy tokenekért lehet bérelni felesleges lemezterületet. A legfőbb üzenete ennek a koncepciónak az, hogy így kiiktatható minden szervezet egyik réme, a 'vendor-lock-in', mivel kiiktatja a nagy adatároló szolgáltatókat. A tranzakciókat átlátható okosszerződések garantálják.
Összességében egy elosztott főkönyvi technológiára támaszkodó platform megbízhatóbb, megfizethetőbb és gazdaságosabb szolgáltatást nyújt, mint a hagyományos felhőszolgáltatók – érvelnek az ilyen rendszerek fejlesztői.
És van még egy érv a szolgáltatók által üzemeltetett hatalmas adatközpontokkal szemben: az energiahatékonyság. A Nemzetközi Energia Ügynökség adatai szerint 2018-ban 2,3 százalékkal nőtt a globális energiafogyasztás, és ebben jelentős szerepe volt az adatközpontok gyarapodásának is. (Egy német lap szerint a németországi adatközpontok több szén-dioxidot termelnek évente, mint a teljes német légi forgalom.) A energiaigényt jól jellemezi, hogy húsz Google-keresés lefuttatásának akkor az energiaigénye, mintha egy átlagos energiatakarékos égő egy órán át világítana. Ez így nem tűnik vészesnek, de a legszerényebb becslések szerint is a Google Search-ön napi 3,5 milliárd keresést indítanak (de olvashatók 6-7 milliárdos becslések is). Innen nézve még inkább felértékelődik a tárolási kapacitások még jobb kihasználását ígérő blockchain-alapú rendszerek.
Elméletben jól hangzik, ha működik…
Ám azokra is ugyanaz igaz, mint a pudingra: jó akkor, ha a gyakorlatban is működik. Egyelőre azonban még kérdés, hogy az elosztott tárolási platformok valóban fel tudják venni a versenyt a Dropboxszal, a Google-lel, az Amazonnal és társaikkal? Tudják-e biztosítani azt a teljesítményt, latenciát, amit a világszerte óriási adatközpontokat működtető szolgáltatók? A válasz egyelőre egyértelmű nem: a nagy adatközpontok gyorsabbak, alacsonyabb a késleltetésük, magasabb a rendelkezésre állásuk. De drágábbak, sokkal inkább ki vannak téve a hekkertámadásoknak, és tetszik vagy sem, a szerződéses garanciák ellenére részben az adatai fölötti ellenőrzést is elveszíti tulajdonosa.
Az elosztott tárolást az ún. IPFS (InterPlanetary File System) protokoll teszi lehetővé. A Protocol Labs fejlesztette rendszer célja a hagyományos HTTP leváltása, hogy egy olyan, valóban decentralizált web jöhessen létre, amely szükségtelenné teszi a gerinchálózatokat.
Az IPFS egy kicsit, de valóban csak nagyon kicsit hasonlít a BitTorrent rendszeréhez, amely még a HTTP-t használja: a rendszerben tárolt állományokat darabokban, elosztottan tárolja, a darabokat egyedi hash-sel azonosítja. A BitTorrenttel ellentétben azonban van egy hatékonyságnövelő eleme: a deduplikálás, azaz hogy az összes redundáns blokkot eltávolítja a hálózatról.
Az IPFS protokollra épülő hálózat működési vázlata

Az IPFS hálózatban részt vevő minden csomópont tárolja a tartalmat a hash-sel és néhány indexelő információval. Amikor a felhasználó le akarja tölteni a fájlt, azt mondja a hálózatnak, hogy keresse meg azokat a csomópontokat, amelyek tartalma egy adott kivonat mögött található. A IPFS a HTTP-vel ellentétben, amely az IP-címekkel operál (helyalapú címzés), tartalomalapú címzést használ, ahol a tartalmakat vagy az elnevezésével (egy szöveges megnevezés) vagy a hash alapján azonosítja.
Már vannak működő projektek
Ma már több olyan rendszer is működik, a két legismertebb IPFS protokollra épülő decentralizált tárolóplatform a FileCoin, ami a IPFS fejlesztőinek a rendszere, valamint a Sia. A FileCoin kriptopénz-bányászattal kapcsolja össze a fájltárolást. Ha valaki FileCoin-bányászként működteti a számítógépét, azzal a gép felesleges kapacitását átadja a rendszernek, amiért cserébe akár kriptotőzsdéken hivatalos pénzre is váltható FileCoint kap.
A FileCoin hálózatban négyféle felhasználótípus van. A kliensek veszik igénybe a tárhelyszolgáltatást. Storage minernek hívják, akik bérbe adják a tárhelyet, és hosztolják a kliensek adatait. A retrieval minerek közvetítő feladatot látnak el, a kliens adatait átadják a storage minereknek, illetve viszont. Emellett vannak a full node-ok, melyek a teljes FileCoin-hálózatot validálják. Feladatuk a rendelkezésre álló tárolókapacitás kiszámítása, a tárolás árának a meghatározása, valamint a többi három szereplő összes hálózati tevékenységének validálása. A fájlok biztonságos tárolását végponti titkosítás biztosítja. Előnye továbbá, hogy az Ethereum Alapítvánnyal is partnerségre lépett.
A másik kezdeményezés, a Sia inkább a fogyasztói piacot célozta meg. A világszerte használt számítógépek szabad lemezkapacitásának felhasználásával fejlesztőinek célja, hogy a tárolás Ubereként vonuljanak be az informatika történetébe. Működése hasonló a FileCoinéhoz. Ugyancsak végponti titkosítást használ, így a tárolókapacitás tulajdonosa nem tudja visszafejteni a nála tárolt fájlok tartalmát. Fejlesztői kiemelten kezelik az adatintegritás kérdését: a rendszer minden tárolt adatot 30 különböző, földrajzilag is elosztott eszközön replikál, ami az adatvesztés kockázatát is csökkenti. A Sia másik nagy előnye az ár: havi 2 dollárba kerül egy terabájt adat tárolása. A rendszer kb. 2 petabájtnyi tárolókapacitást kezel, amit közel 350 független szolgáltató biztosít.
Emellett több egyéb kezdeményezés is van, többek között a Storj (újabb nevén tardigrade.io), a PPIO, az X Cloud, az 0Box, az Opacity is hasonló elven működik. A PPIO azonban annyiban más utat követ, hogy kizárólag a fejlesztőknek szánták a Google Cloud vagy az AWS S3 alternatívájaként. Ez többek között decentralizált alkalmazásstreaminget, privát adattárolást, adatcserét, és adattárház szolgáltatást is nyújt.
Az ötlettől az értékteremtésig – az üzleti réteg szerepe az adattudományi működésben
Az adattudomány valódi értéke ott válik láthatóvá, ahol az előrejelzések döntésekké, a döntések pedig mérhető üzleti eredményekké alakulnak. Ehhez azonban tudatos üzleti beágyazásra, mérési keretrendszerekre és következetes visszacsatolásra is szükség van.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak