ニフクラ ブログ

ニフクラ/FJ Cloud-Vやクラウドの技術について、エンジニアが語るブログです。

クラウドを活用したDR対策の始め方

f:id:marketing_fjct:20200717153304p:plain

こんにちは、富士通クラウドテクノロジーズのコウノです。
そろそろ夏本番ですが、皆様の好きなアイスは何でしょうか?
ちなみに私はサクレです。

今年も各地で大雨による洪水などの自然災害が発生していますが、皆様ご無事でしょうか?被災地の1日も早い復興を心よりお祈り申し上げます。

災害(地震や台風など自然災害やテロ、サイバー攻撃も含む)は人だけでなく保有する建物や機器の損失など多くの被害を生みます。そのような状況に備えてDR対策を行い、自社のIT資産を守っていく必要性が年々高まっています。

ただし、皆様の中には以下のような不安を抱いている方がいらっしゃるのではないでしょうか?

・DRって聞いたことあるけど、何から始めればいいのか分からない…
・新型コロナを含む災害に対してIT資産をどのように守っていけばよいのか、基本から知りたい!
・オンプレミス環境でのDRとクラウドを活用したDRって何が違うのだろうか?

このような方々に向けて、今回は「クラウドを活用したDR対策の始め方」ということで、 DRの概要、クラウドとオンプレミスでのDR対策の違いなどの基礎知識から、クラウドを活用したDR構成例までを幅広くご紹介できればと思います。

DRとは

まずDRって何だっけ?という方もいるかと思います。その定義を簡潔に説明すると、DR(ディザスタリカバリ)とは主に、災害が発生し、IT資産へ直接的・間接的な被害(建物の崩壊や交通機関の停止など)を受けた際の復旧体制のことを指しています。

さらに、DRといえば、自然災害による物理的な機器の被害など、直接的な被害を思い浮かべますが、冒頭の不安要素でもあったように、新型コロナ感染症などによってオフィスビルが立ち入り禁止となり機器が使用できないなどの間接的な被害もDRの一つのケースとして認識しておく必要があります。

つまり、自然災害が頻繁に発生し、また新型コロナ感染症の終息が見えない現在の日本において「避けては通れない問題」それこそがDR対策なのです。

DRに関する考え方

しかし、そのようなDRに対して何から始めればよいか分からない!そう感じる方もいらっしゃるかと思います。
そこで、DRを考える上での重要な三つのポイント(RLO・RPO・RTO)をご紹介します。

1) RLO(目標復旧レベル)
予めメインサービスの稼働に必要な組み合わせの優先順位を決め、最適な復旧構成をとること効率的な投資が可能となります。 ゲームで例えると、ボス戦を前に各メンバーや武器の「最適な組み合わせ」を考えておくイメージです。

2) RPO(目標復旧ポイント)
これは災害発生前の最新データの復旧に関する指標です。またゲームで例えると、ボス戦の前にセーブしておくことで、負けてもその「時点」まで戻ることができるイメージです。

3) RTO(目標復旧時間)
これはデータやシステムの復旧までの「時間」に関する指標です。またまたゲームで例えると、電源が切れた後にどれだけ早く再起動できるかの「時間」のことです。

つまり、組み合わせやその際のコストを検討する中で(RLO)、なるべく最新のデータをセーブし(RPO)、なるべく早く再起動できる(RTO)ような構成を目指していくことが、DR対策のスタート地点となっているのです。

DRとクラウドの関係性

前項で説明した三要素にそって、DRでは基本的な方法論として以下の三点が挙げられます。

1.データのバックアップ
2.遠隔地へのバックアップ
3.データレプリケーション

ただ、実際にこれらを行うためにはオンプレミスだと非常にコストがかかり、なかなか実現は難しいものでした。 そこで、クラウドが登場しその実現性は高まりました。その理由は以下になります。

まず、クラウドとは何かを改めて整理すると、サーバーなどのITリソースを必要な時に必要な分だけオンデマンドに利用できるサービスです。

今までのオンプレミス環境では、ITリソースの購入・運用・改善などの業務は会社全体、特にIT担当者の負担がコスト・体力的にも非常に大きなものでした。しかし、クラウドを活用することでサーバーリソースの導入がスムーズかつその増減が容易となり、また必要な時に必要な分だけ利用できコスト最適化が可能となったため、これらの業務に対するIT担当者の負担は大幅に軽減されました。

また、クラウド環境・オンプレミス環境どちらにおいても、災害発生時にIT基盤が一か所に集中していると、システムが一度にすべて停止するリスクを抱えています。DRの観点では、複数のIT基盤を活用していることが重要となり、クラウドの活用はDR方法における特に遠隔地へのバックアップやデータレプリケーションの際に非常に有効なものとなるのです。

つまり、クラウドの登場によってDR対策における選択肢が大きく広がったのです。 バックアップの具体的な方法についてはこちらの記事もご覧ください。

pfs.nifcloud.com

DRにクラウド使うメリット

ここで、DRにおいてクラウドを活用する三つのメリットについても整理していきます。

  1. オンデマンド性
    クラウドを活用することで、場所や媒体を問わずサーバーなどのITリソースにアクセス可能となります。 それは、DRにおける交通機関の停止や感染症の拡大によるIT資産の運用停止の被害を回避することにつながります。

  2. 可用性の向上
    オンプレミス環境では災害発生時に、機器が故障すると、一定期間システムが停止してしまいますが、クラウドではIT基盤の分散を簡単に行えるなど、システムが停止しない、またはすぐに復旧可能なシステムの構成が可能となっています。

  3. 復旧の速度
    オンプレミス環境では、DRによる物理的な機器の損傷などが発生した際に、追加でIT資産を購入したりシステム構成を再構築したりするのに、多くの時間を要します。一方、クラウドでは先ほど述べたオンデマンド性やIT資産の拠点分散が可能な点や、データのレプリケーションが簡単な点から早い復旧速度を維持できるのです。

リージョンとゾーン

リージョンとゾーンとは冒頭で説明した「複数のIT基盤を活用する」ことを体現するための概念であり、オンプレミス環境では考慮されにくいものの、クラウドを活用したDR対策を行う上で非常に重要な概念となっています。

まず、リージョンとはデータセンターなどのIT基盤が設置されている地域のこと、ゾーンとはリージョン内に分散して存在する各施設のことを指しています。
例えば、ニフクラでは東日本と西日本、北米の三ヶ所にリージョンがあり、東日本と西日本のリージョンには幾つかのゾーンが存在するという構成になっています。

これまで述べてきたように、DR対策としてIT基盤を複数に分散して持つことは重要な要素となっています。つまり、クラウドを活用して複数リージョン・ゾーンにIT基盤を構築し、各IT基盤に物理的な距離をとることで、災害のダメージが限定的となりシステムの継続運用を実現することができるのです。

また、その際に各リージョンやゾーンを拠点間VPNゲートウェイプライベートブリッジなどで接続することで、可用性を上げたり帯域確保したりすることが可能となり、より迅速なDR対策を行うことができます。
リージョンとゾーンについて詳しく知りたい方はこちらの記事もご覧ください。

blog.pfs.nifcloud.com

また、補足ですがマルチクラウドという概念もDR対策の一つとして可能性を持っています。
これは複数のパブリッククラウドを組み合わせて活用することで、各クラウドのメリットを活かせるという考え方であり、クラウドの基盤を単一にしないことで災害リスクの分散が可能となるというDR的側面も持っています。

まとめ

このように、自然災害が多く感染症も終息の見えない中で自社のIT資産を守るためにもクラウドを活用したDR対策は考慮すべき最優先課題の一つであり、未来への投資として自社のできる範囲でそのような課題に対して準備を進めてみてはいかがでしょうか?

最後に、今回はクラウドによるDR対策をまとめましたが、可用性の向上という点では他にも様々な対策が考えられます。 それについてより具体的かつ詳細に解説したebook「可用性の向上」 もありますので、是非ともご覧ください。

https://pfs.nifcloud.com/navi/images/bnr_availablepoint.gif

おすすめ記事

プライベートLAN同士を接続する機能 プライベートブリッジ の提供を開始しました - ニフクラ ブログ
ニフクラのインターネットVPN機能に関するまとめ(前編:拠点間VPNゲートウェイ) - ニフクラ ブログ
ニフクラDNSを利用してリージョンを跨いだDR構築を試してみる - ニフクラ ブログ