“Jahr-2012-Problem” bei Windows Azure: 12 Stunden Totalausfall in der Microsoft-Cloud

WinAzure_v_cBei einige Windows Azure-Diensten traten gestern und vorgestern gravierende Störungen auf. Betroffen davon war vor allem das Windows Azure Service Management, das weltweit ausfiel – in manchen Regionen über 12 Stunden lang. Wie ernst die Lage war, zeigt eine Stellungnahme aus der Microsoft-Führungsebene: In einem Blogbeitrag erklärte Bill Laing, Corporate Vice President Server and Cloud, die Situation und entschuldigte sich bei den Kunden für die entstandenen Unannehmlichkeiten.

The Register berichtete gestern als erstes vom Ausfall und zitierte dabei einen Azure-Kunden, der von einem “Admin-Nightmare” sprach und die fehlende Redundanz beklagte. Die Probleme begannen demnach am 28.2. um zirka 15 Uhr MEZ. Nach dem Ausfall der Management-Komponente kam es auch zu Ausfällen bei Azure Compute und Access Control.

In einer Stellungnahme nannte Microsoft als Ursache ein fehlerhaftes Sicherheitszertifikat, das offenbar mit dem gestrigen Schaltjahresdatum, dem 29.2., nicht zurecht kam. Laut Laing konnte der Fehler erfolgreich behoben werden, es komme nur noch teilweise zu Störungen. Windows Azure Storage sei nicht betroffen gewesen.

Azure-Kunden können sich auf dem Service-Dashboard in Echtzeit über den Service-Status informieren.

wm@sharepoin