Pár napja ugyanis 18 perces szolgáltatáskiesés volt a Google Compute Engine-ben. Más szolgáltatásokat nem érintett a leállás.
Hirdetés
 

Bocsánatot kért ügyfeleitől a Google, amiért április 11-én 18 percre leáll a Compute Engine szolgáltatása gyakorlatilag minden régióban. A leállásról a cég tegnap részletes beszámolt egy blogbejegyzésben, amelyben a műszaki okokat is részletezte.

Rutinmunkának indult

A hiba egy már begyakorlott frissítés közben lépett fel. A mérnökök eltávolítottak a hálózatból egy használaton kívüli IP-blokkot, majd pedig életbe lépett az automatikus folyamat, amely a módosított hálózati konfigurációt érvénybe lépteti. Mint írják, ez olyan rutinfeladatnak számít, amelyet már számtalanszor végrehajtottak. Csakhogy most a hálózatmenedzsmentért felelős szoftver hibát jelzett. Ilyenkor az a protokoll, hogy a rendszer visszatér a korábbi hálózatkonfigurációhoz. Ehelyett azonban a menedzsment szoftver a hibás hálózati konfigurációt kezdte teríteni.

A felhő biztonsága május 5-6-án a tavaszi CIO Hungary konferencián is terítékre kerül.

Az eredmény végül az lett, hogy a Google Compute Engine több régió több adatközpontjában leállt 18 percre. A Google hangsúlyozta, hogy a leállás nem érintett más szolgáltatásokat, például a Google App Engine-t, a Google Cloud Storage-ot és más termékeket, ami persze kevéssé vigasztalja azokat a vállalatokat, melyek a Compute Engine-en futtattak valamilyen munkát. Ugyanakkor a Google súlyosnak ítélte a hibát, ezért egyrészt megelőző intézkedéseket vezettek be, és egy mérnökcsapat dolgozik azon, hogy a hasonló hibák lehetőségét minimalizálják.

A leállás okozta reputációs károkat azzal próbálják mérsékelni, hogy a szolgáltatásra adott SLA-nál (Service Level Agreement) nagyobb mértékű kedvezményt adnak az érintett ügyfeleinek: a havidíjból 25 százalékot, a megvásárolt kreditek árából 10 százalékot.

Globális szolgáltatás – globális hiba

Az eset ismét rávilágít arra, hogy bár a felhős szolgáltatások nagyon komoly üzembiztonságot kínálnak, a kiterjedt és komplex rendszerekben felmerülő hibák – legyenek azok műszaki jellegűek vagy emberi mulasztásra visszavezethetők – egy globális szolgáltatónál globálisan jelentkezhetnek. Ezáltal világgazdasági szinten sokkal nagyobb károkat tud okozni akár egy rövidebb szolgáltatáskimaradás is, míg egy lokális rendszer hibája csak annak tulajdonosát érinti – meglehet őt magát súlyosabban, mert például lassabban tudja helyreállítani a rendszere működőképeségét.

Érdekes az is, hogy a műszaki hibák egyik forrása nem egyszer éppen az, ami a hibák minimalizálását hivatott szolgálni: a folyamatok automatizálása. Ez történt a Google esetében is: egy már többször kipróbált automatizált folyamat okozta egy szolgáltatás globális kiesését.

Ugyanakkor hiba lenne csupán egy ilyen probléma alapján eldönteni, hogy használ-e valaki bármilyen felhős szolgáltatást. A Gartner CloudHarmony nevű cége folyamatosan monitorozza az egyes felhőszolgáltatók rendelkezésre állását, és megadja a leállási időket is. Érdemes ezt összevetni a saját rendszer hasonló adataival. Valószínűleg sokat segít a döntésben. Mindazonáltal döntsön egy vállalat bárhogy is, bizonyos mértékig mindenképpen fogadás köt: azaz nincs száz százalékos üzembiztonság, mert ahogy Murphy mondja, ami el tud romlani, az el is romlik. A kérdés éppen ezért inkább az, hogy milyen gyorsan lehet megjavítani. És ebben a felhőszolgáltatók egyre nagyobb előnyben vannak, mert méreteikből adódóan a szükséges szakértelmet is folyamatosan biztosítani tudják.

A leállás műszaki háttere részletesen tanulmányozható a Google hivatalos blogbejegyzésében, melynek végén az incidens pontos kronológiáját is közlik.

Cloud & big data

Bezárult az olló: okostelefon 8 GB RAM-mal

A Razer készüléke ebben a tekintetben az asztali számítógép szintjére emeli a mobil kommunikációs eszközöket.
 
Hirdetés

Megújult a First Class csomag – uniós adatroaming akár 70 gigabájtig

A változtatásokkal az elsősorban üzleti ügyfelek igényeire szabott ajánlat még rugalmasabb, miközben a prémium jellege is megmarad.

A technológiai fejlődés jó, csak épp még az adatvédelmi kockázatok is nőnek vele. A vállalatoknak pedig ezzel kell valamit kezdeni a változó adatkezelési szabályozás miatt. Összegyűjtöttük, mire kell figyelni.

a melléklet támogatója az Aruba Cloud

Hirdetés

A CISPE adatvédelmi magatartási kódex szerint szolgáltat az Aruba

Az Aruba Cloud minden felhőszolgáltatása megfelel azoknak az előírásoknak, amelyeket az európai felhőinfrastruktúra-szolgáltatók szakmai szövetsége adatvédelmi magatartási kódexében rögzített.

A koncentrált erőforrások kockázatai is koncentráltan jelentkeznek. Az informatikai szolgáltatóknak, felhős cégeknek érdemes lenne körülnézniük a közműszolgáltatóknál, hogyan kezelik ezt a problémát.

Sikeremberektől is tanultak a CIO-k

a Bitport
a Vezető Informatikusok Szövetségének
médiapartnere

Hogyan forradalmasítja a számítástechnikát a nanotechnológia? Majzik Zsolt kutató (IBM Research-Zürich) írása. Vigyázat, mély víz! Ha elakadt, kattintson a linkekre magyarázatért.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthetően, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport ötödik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2017 Bitport.hu Média Kft. Minden jog fenntartva.