サーバーは復旧し、ユーザーは再び Foursquare にチェックインしたり、Quora で質問したりできるようになりましたが、先週の Amazon Elastic Cloud Computing (EC2) の障害の遺産は今後も残り、IT の将来にクラウド コンピューティングを検討する企業にとって重要な教訓となるでしょう。
これまでにもクラウド障害は大きな注目を集めてきましたが、Amazonの予期せぬダウンタイムの規模と長さ、そしてそれに巻き込まれた一部の顧客の評判を考えると、今回の影響はさらに大きくなります。Amazonが原因究明に奔走する中、クラウドへの移行における混乱に備えるための方法をご紹介します。

Amazonは、クラウドデータセンターをアベイラビリティゾーンに分割することで、冗長性を確保しています。これは、複数の水密区画を持つ船を設計し、1つか2つが損傷しても船が浮かんでいるようなものです。しかし、歴史が示すように、「沈まない」船は真に沈まないわけではなく、そう信じるのは愚かなことです。設計を信頼しつつも、十分な救命胴衣を船内に備えておくことが重要です。
約 2 日間のダウンタイムによって信頼性に大きな穴が開いたにもかかわらず、クラウド コンピューティング全般、特に Amazon EC2 は、複雑なコンピューティング要求の管理をオフロードする機能など、中小企業コミュニティに依然として魅力的なメリットを提供しています。
Amazonのような障害がもたらす潜在的な課題の一部を軽減する方法は存在します。ある程度の注意と事前の検討があれば、中小企業でもクラウドを活用することで、IT管理における「現状維持」に費やす時間と費用を削減し、テクノロジーを通じたイノベーションへの投資を増やすことができます。
ミッションクリティカルとは何ですか?
FoursquareやQuoraのように、インターネット接続に依存する企業は、クラウドコンピューティングの価値提案に他の企業よりも強く惹かれています。使用量に応じて環境(そして料金)をスケールアップまたはスケールダウンできる機能は大きなメリットです。しかし、これらの企業は、インターネットベースのサービスが文字通りビジネスそのものであるため、ダウンタイムが発生した場合に最も大きな損失を被る可能性も秘めています。
しかし、次に注目を集めるソーシャルメディアサイトを立ち上げる予定がない限り、あなたは少し幸運です。ITインフラの一部を自社内で維持し、残りをアウトソーシングすることで収益を最大化することができます。
クラウドは必ずしも全てかゼロかということではありません。メールやウェブサイトは、ビジネスにとって非常に重要で、他者の監視下に置けないかもしれません。しかし、テストや開発のワークロードはクラウド上で問題なく稼働できるかもしれません。クラウドプロバイダーの信頼性に不安がある場合は、ダウンしてもビジネスに影響しない、あるいは必要な場合でもしばらく待機できるワークロードにクラウドを使用してください。
多様化、多様化、多様化
アクセス性、柔軟性、経済性の観点から、最も重要なITインフラさえもクラウドに展開することが理にかなっている場合、クラウド環境を活用する方法があります。クラウド環境が、少なくとも現地のネットワーク、サーバー、ストレージインフラと同等の冗長性と災害対策を備えていることを確認する必要があります。

PC Worldの同僚トニー・ブラッドリーは、Amazonのクラウド上で運営されているオンライン写真共有ウェブサイトSmugMugを例に挙げています。SmugMugはAmazonのクラウド崩壊をほとんど無傷で乗り越えました。SmugMugの場合、クラウドの適切な場所に適切なタイミングでアクセスし、Amazonのサービスの中で最も大きな打撃を受けたElastic Block Storageに加入していなかったことが大きな要因でした。
ただし、念のため、ワークロードが重要な場合は、複数のクラウド プロバイダーとの関係を構築して、クラウドでもビジネスが単一障害点に陥るのを防ぐことを検討する価値があるかもしれません。
SLAは重要
クラウドプロバイダーと契約交渉を進める際には、各プロバイダーとのサービスレベル契約(SLA)をじっくりと検討してみてください。SLAには、サービスが正常に提供された場合のプロバイダーへの報酬と、サービスに問題が発生した場合のお客様への補償内容が明記されている必要があります。
特に、Amazon、Google、その他の大手パブリッククラウドインフラベンダーと提携しているローカルサービスプロバイダーと連携している場合は、SLAに問題発生時の責任の所在が明記されていることを確認してください。関係構築の初期段階で、SLAが明確で包括的かつ確固としたものであることを確認するために、時間と労力をかける価値は十分にあります。
何か問題が発生した場合、ベンダーが責任転嫁され、ビジネスがオフラインのまま停滞するような事態は避けたいものです。まさに、誰かの首を絞めたい状況であり、その首が誰のものかを明確にしておきたいものです。
ロバート・ダットはベテランITジャーナリスト兼ブロガーです。ChannelBuzz.caでカナダのITテクノロジーソリューションプロバイダーの動向を日々取材しています。Twitterでもフォローできます。