
アマゾン・ウェブ・サービスのダブリン・データセンターでの停電後のサービス復旧作業は、月曜日にEBS(Elastic Block Storage)ソフトウェアのエラーによりさらに複雑化したと同社が発表した。
ソフトウェアエラーの結果、EBSスナップショット管理システムは一部のブロックが使用されなくなったと誤って判断し、それらを削除したと、アマゾンは午後3時11分(太平洋夏時間)にサービスヘルスダッシュボードに記した。
同社は、このエラーの再発防止策を講じ、欠落ブロックを含むすべてのスナップショットを無効化しました。また、影響を受けた顧客には、スナップショットの新しいコピーが利用可能になり次第、データを復旧するためのメールを送付するとのことです。
午後10時1分(太平洋夏時間)、Amazonは、停電時に完全に整合性があったことが確認できたすべてのEBSボリュームとEC2(Elastic Compute Cloud)インスタンスを回復したと発表した。
しかし、一部のEBSボリュームに一貫性を持って保存されなかった書き込みがあったかどうかは確認できませんでした。この問題を解決するため、影響を受けたボリュームのリカバリスナップショットの作成を開始しました。Amazonによると、スナップショットは利用可能になり次第、ユーザーのアカウントに追加されます。このプロセスには時間がかかり、完了するまでに最大24時間かかる可能性があるとのことです。
可用性の問題は、日曜日の午前10時41分(太平洋夏時間)に変圧器に落雷し、爆発と火災が発生し、停電が発生した後に始まった。
ここ数日、Amazon Web Servicesにとってはあまり良い状況ではありませんでした。ダブリンでの問題に加え、Amazonは米国でもネットワーク接続の問題により一時的なサービス停止に見舞われました。
ニュースのヒントやコメントは[email protected]までお送りください。