Több mint 12 óráig elérhetetlen volt Európa egy részén a Google felhője

Bitport2024.10.25.Cloud & big data

A felhőszolgáltató frankfurti Europe-West3 régiójának három zónájából állt le egy áramkimaradás és hűtési problémák miatt.

Jelentős szolgáltatáskiesést tapasztalhattak a Google egyes európai ügyfelei a hét közepén. Október 24-én helyi idő szerint éjszaka fél 3-kor leállt a Frankfurtban található Europe-West3 régió három zónájából egy, és csak 15:09-kor, azaz pontosan 12 óra 39 perc múlva sikerült életre kelteni a szolgáltatásokat.

"Elnézést kérünk a szolgáltatási zavar/kimaradás okozta kellemetlenségekért" – írta a Google supportja a kimaradásról szóló jelentésében. A jelentés szerint az incidenst áramkimaradás és hűtési problémák okozták, de a Google további vizsgálatokat is ígért, melyek eredményéről szintén tájékoztatja az ügyfeleket.

Az adatközpont leállása közvetlenül tíz szolgáltatást érintett (Persistent Disk, Google Compute Engine, Google Cloud Pub/Sub, Google Cloud Dataflow, Dataproc, Cloud Build, Google Kubernetes Engine, Vertex AI Batch Prediction).

Ezt tapasztalták a felhasználók

Ügyféloldalon az incidensnek számos jele lehetett, melyekből a felhasználók nem is feltétlenül tudták azonosítani a problémát. Ha valaki a Google Compute Engine szolgáltatást használta, azt érzékelhette, hogy virtuális gép létrehozásakor hibaüzenetet kap, vagy a törlések feldolgozása nagyon lassú, illetve hogy bizonyos VM-példányok elérhetetlenné váltak.

A Google Kubernetes Engine-ben elérhetetlenek voltak az érintett zónában található node-ok, és újakat sem lehetett létrehozni. A Google Cloud Dataflow batch munkafolyamatai belassultak, nem működött a skálázás. A Google Cloud Dataproc-fürtök működőképesek maradtak ugyan, de többször nem lehetett új fürtöt létrehozni. (A Google-support által eddig azonosított problémák teljes listája az incidensriportban olvasható.)

A jelentés a Google Compute Engine kapcsán megjegyzi: bár a régió másik két zónáját az incidens közvetlenül nem érintette, ott is tapasztalhattak fennakadásokat az ügyfelek például a lemezerőforrásokat és az instance-okat érintő műveleteknél, ám a hibaarány még az 1 százalékot sem érte el. A Vertex AI Batch Predictionnél viszont már sok esetben régiós szinten jelentkezett az a probléma, hogy egyes műveletek időtúllépés miatt meghiúsultak.

A Google a leállás után 26 perccel értesítette az érintett ügyfeleit, de megoldási javaslattal csak három óra elteltével szolgált: helyezzék át munkaterheléseiket más régiókba vagy zónákba. A regionális Persistent Disk szolgáltatást használóknak pedig azt javasolták, hogy készítsenek rendszeresen snapshotot a lemezről.

Nem Frankfurtban van a hiba...

A frankfurti régió eddig többnyire stabilan működött. Voltak ugyan kisebb leállások, tavaly tavasszal például egy félresikerült frissítési-karbantartási művelet miatt vált közel három óráig elérhetetlenné több mint harminc szolgáltatás.

Hűtési problémák is okoztak már galibát, ha nem is a német város környékén. 2022-ben Dél- és Kelet-Angliában extrém hőhullám miatt volt jelentős kimaradás a Londonban működő Europe-West2 régióban, valamint az Oracle ottani adatközpontjaiban.

Adatközpont-szakértők már akkor arra figyelmeztettek, hogy a klímaváltozás egyre nagyobb kihívás elé állítja az adatközpont-üzemeltetőket (különösen a hyperscale szolgáltatókat). Azóta pedig az is kiderült, hogy van más probléma is: a mesterséges intelligencia körüli hájp olyan mértékben pörgette fel az adatközpontok energiaigényét, hogy azt egyre nehezebben tudja kiszolgálni az infrastruktúra (és persze a hangzatos klímacéloknak is annyi).

Azaz beválhat a Gartner ügyvezető alelnökének jóslata. Alan Waite tavaly egy konferencián azt taglalta, hogy bár a felhős infrastruktúra leállásának kockázata egyre kisebb (ritkább, rövidebb ideig tart és korlátozott a hatóköre), ha bekövetkezik, az az érintetteket rendkívül súlyosan érinti. De ha élvezni akarjuk a felhő előnyeit, akkor érdemes felkészülni a hátrányaira is, köztük a rövidebb-hosszabb szolgáltatáskimaradásokra.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

Elkeseredett hírességek próbálják visszafogni az MI-fejlesztők versenyét

Több ezer befolyásos személyiség csatlakozott ahhoz a kezdeményezéshez, ami kötelezően leállítaná az emberfeletti szuperintelligencia felépítésére irányuló munkát, a tiltás feloldását pedig tudományos konszenzushoz és a közvélemény támogatásához kötné.

Hirdetés

Az end-to-end védelmeké a jövő

A kódbiztonság integrálásával új fejlődési szakaszukba léptek a felhős védelmi platformok. Werner Obringot, a Clico Hungary cloud security architektjét kérdeztük a miértekről és hogyanokról.

A hónap témája

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

A biztonsági megoldásszállítók érthető módon egy irányba mozdulnak, hiszen ugyanazoknak a támadásoknak az ellenszerét keresik. Megoldási javaslataikban sokszor csak árnyalatnyiak a különbségek, ami egyszerre könnyíti és nehezíti a választást.

a melléklet támogatója a Clico Hungary

CIO Podcast

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

CIO Podcast #63: A stressz, a felső vezetők és két perc néma csend

MÉG TÖBB CIO PODCAST »

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Elkeseredett hírességek próbálják visszafogni az MI-fejlesztők versenyét

A CNAPP-oknál is a legnehezebb kérdés: melyiket válasszuk

CIO Podcast #64: Ami megfelelőségi audit, az IT is?

Régen minden jobb volt? A VMware licencelési változásai

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Budapest 2025 konferencia