Microsoft odtajnil důvod pádu Azure z 29. února

Jak jsme vás již informovali dříve, cloudová služba Windows Azure nezvládla datum 29. února univerzálního času a měla výpadek ve většině svých datacenter. Microsoft dodržel slovo a po deseti dnech od incidentu skutečně odtajnil detaily pádu.

Výpadek postihl celkem čtyři ze šesti datových center v Evropě, USA i Asii a plný rozsah služeb se podařilo obnovit až po dvou dnech.

Nedostupnost služby trvala v různém rozsahu na jednotlivých místech od 29. února až do 1. března. Azure podobně jako další cloudové služby pro zjednodušení správy běží ve virtuálních strojích a právě to se mu stalo osudné. Selhal totiž certifikační mechanismus Virtuálu, který zabezpečuje samotou infrastrukturu a zavádí další Virtuální stroje.

Potíž spočívala v tom, že tento software vytváří asymetrický klíč a bezpečnostní certifikát, který je poté využíván ostatním softwarem a dalšími VM pro zabezpečenou komunikaci s obslužným programem v hostitelském operačním systému. Tento software vytváří certifikát s roční platností a jako začáteční den platnosti nastavuje vždy aktuální datum. Program ovšem poslední den nevypočítává, pro zjednodušení pouze vezme aktuální datum a zvýší rok o jedna. Zákonitě tak v případě 29. února u certifikátu, který měl skončit svoji platnost 29. února 2013, dospěl k neplatnému datu.

Protože selhalo vytvoření certifikátu, končily chybou všechny pokusy o vytvoření nových VM, ale také pravidelný globální upgrade softwaru, virtuální stoje se následkem toho začaly sypat jako domečky z karet.

Windows Azure je kombinací dvou typů služeb, a to SaaS (Software as a Service) a IaaS (Infrastructure as a Service). Zákazníci mají k dispozici datový prostor a výpočetní výkon serverů, které jsou umístěny v datových centrech Microsoftu po celém světě.

Exit mobile version