「クラウドサービスの大規模障害とその対策の検討方法」
日本クラウドコンピューティング株式会社
代表執行役 ITコンサルタント
清水 圭一
2019年8月23日に、大手のクラウドサービスの一つであるアマゾン・ウェブ・サービス(Amazon Web Services、以下AWS)の東京リージョンで障害が発生し、国内のさまざまなサービスに影響を及ぼしました。
AWSが復旧するまで、モバイル決済サービス「PayPay」や、仮想通貨取引所「Zaif」、オンラインゲーム「アズールレーン」、PCショップの「ドスパラ」などのサービスが停止するなど、社会的な影響もありました。
AWSという1つのクラウドサービス障害が起きただけで、多くの企業やサービスに影響を及ぼしたため、クラウドの信頼性に疑問を持った印象をもたれる方も多かったのではないかと思います。
本日はクラウドの信頼性の考え方と、万が一のクラウドの障害に対応する方法、また、ICTシステムの業務継続とコストの観点から、どこまで企業のICTシステムでも業務継続に投資をするかについて解説をします。
クラウドと自社システム構築との対比による投資判断
つい十数年前までは、自社の業務システムは、自社構築するのが当たり前で、クラウドを使うこと自体が珍しい状況でした。
その場合、業務システムが稼働しているオンライン時間も、夜間メンテナンスなどの時間から、9時から22時までなどの場合が多く、利用も限定的でした。
それがクラウドの登場によって、安価な利用料金で夜間メンテナンス時間を極小化したり、システムを二重化することにより、業務システムのメンテナンス時間の制約がなくなってきました。
例えばAWSの主要サービスである「Amazon EC2」において、顧客とのSLA(サービスレベル契約)として提示している稼働率は99.99%ですので、年間の停止時間は約53分になります。
一方、クラウドの信頼性は疑問だからといって、システムを自社構築をして、クラウドと同じような稼働率を実現するとなると、サーバーやホストの二重化などのコストがかさみます。
ここで検討しなければないならいのは投資対効果です。
実際に自社でクラウドサービス以上のの信頼性を確保したシステムを作る選択をする場合には、そのシステムが停止したときの機会損失を算定する必要があります。
この機会損失額が、数億あるいは数十億円以上と言うのであれば、クラウドサービスよりも優れた信頼性、安全性、セキュリティを兼ね備えたシステムを自社で構築するメリットがありますし、経営層にもそのような判断をしてもらうことが可能です。
しかしながら、クラウドサービスの信頼性に不安を覚え、クラウド以外の選択肢を検討する企業は、その業務システムがダウンした時の機会損失を算定し、その金額を含めて、自社構築でクラウドよりも信頼性、安全性、セキュリティを兼ね備えたシステムを作った場合のコストを比べ、数値化したデータで比較検討をしなければなりません。
2つのクラウドサービスを使うという選択
また、クラウドサービスをより信頼性、安全性、セキュリティを兼ね備えて使うための選択肢としては、1つのクラウドサービスではなく、2つ以上のクラウドサービスを利用し、万が一特定のクラウドサービスが利用できなくなった時は、もう1つ、別の会社のクラウドサービスに切り替えて使う方法があります。
コストは、場合によっては2倍近くに跳ね上がってしまいますが、信頼性をより高めて業務システムを利用したい場合に有効です。
万が一のクラウドサービスの停止の際や、大規模広域災害などで、クラウドサービスのデータセンターが致命的な損傷をした場合などでも、業務継続が出来るメリットを手に入れることができます。
また、この方法は、万が一の有事の際に使うクラウドサービスが、性能や信頼性がある程度損なわれても良いと割り切るのであれば、安価に構築することも可能です。
最近では異なるクラウド事業者同士が相互接続するサービスも始まっています。
そのようなサービスをうまく利用することにより、特定のクラウドサービスが障害で使えない場合も、もう一つのクラウドサービスに切り替えることが出来る環境が整いつつあります。
飛行機事故とクラウドの障害の関係
今回のようにクラウド関連の大規模障害やセキュリティ事故が発生すると、多くの人は、感情的にクラウドに対する信頼性に疑問を持ちます。
これは航空機事故と一緒で、一度、航空機事故が起こると、飛行機は危ないと、多くの人が、自動車や電車など他の交通手段を使うようになります。
しかしながら、事故率や死亡率と言う意味では飛行機は80歳まで毎日乗って事故に遭う確率が0.02パーセントしかないのに比べて、自動車は1年間で0.58パーセントの確率で事故に遭遇します。
最も安全なのは飛行機であることは統計的な数字からも表せられているにも関わらず、一度、航空機事故が起こると飛行機を避けてしまいます。
クラウドサービスの大規模な障害やセキュリティ事故等も同じように感情的な判断をされ、本来、考えなかればならない発生率やその損失金額など、数値的な事実を見なくなってしまいます。
大部分のクラウドサービスは、自社でシステム構築をするよりもほとんどの場合において信頼性も高く、データ消失などの確率も低くなっています。
こういった具体的な数値を確認しつつ、自社にとって何が適切なICTシステムなのかを検討して頂ければと思います。
JUGEMテーマ:ビジネス