VWシリーズ:クラウドを利用したディザスタリカバリ(DR)環境の構築

カテゴリー: VWシリーズ, サービス情報, 技術情報   パーマリンク
このエントリーをはてなブックマークに追加

IIJのプロフェッショナルサービス部門では、「IIJ GIOコンポーネントサービス 仮想化プラットフォーム VWシリーズ」(以下、VWシリーズ)を活用した様々なソリューションの検証を行っています。
今回はその中から、クラウドを利用したディザスタリカバリ(DR)環境の構築をご紹介します。VMware vCenter Site Recovery Manager 5.0(以下、SRM)を使い、クラウドとオンプレミス間でVMwareベースのDR環境の構築と機能検証を行いました。

背景

昨今、「クラウドサービスを利用して、資産を持たずに企業のITシステムのDRサイトを構築したい」というご要望を多くいただいています。
DRサイトに対する要件は、災害等不測の事態によるデータ消失に備えたデータのリモートレプリケーションに留まらず、速やかなサイト切り替えで業務の停止を少なくすることが求められています。

DRにクラウドを利用する理由

クラウドサービスを利用すると、準備期間の短縮や、必要な分だけ利用料を支払えばよいといったメリットがあります。特にDRサイトでは遠隔地にシステムを構築するため、クラウドを使うことで待機側(遠隔地)のインフラ周りの管理や運用の負担をカットできるという効果も期待できます。

ストレージのレプリケーション機能を使わないリモートコピー

従来のDRではストレージ機能によるデータレプリケーションが主流でしたが、最新バージョンのSRMではサーバベースのレプリケーションが可能になっています。この仕組みはストレージの機能を使用しないため、より手軽にDRを始められるようになりました。SRMにはテスト切替機能があり、避難訓練的にサイト切替が正常に行われるかどうかをテストすることが可能です。今回は、このVMwareを利用したサーバベースのレプリケーションを使用して検証を行いました。

検証環境

VMware vCenter Site Recovery Manager(SRM)によるDR環境
(クリックすると拡大表示します)

検証環境とシステム構成

両サイトのロケーションは、クラウド側はVWシリーズ、オンプレミス側は外部の検証環境を使用します。ネットワーク環境は、両サイトのサーバをそれぞれインターネットに直結し、各々のESXi上に仮想マシンとして「SEIL/x86」をインストールしてIPsec VPNを構成しました。両サイト間の実効速度は25Mbps(8KB程度のデータ利用時)でした。

ストレージはサーバのローカルHDDに相当するものを使用しました。クラウドとSRMを組み合わせて使うことで、このような小規模な環境でもDRを構成できます。

検証構成

オンプレミス側とクラウド側の検証構成

検証結果とSRM構成のポイント

検証項目

検証項目の概要

本検証では、データのレプリケーション、フェイルオーバー、フェイルバックの正常動作の確認とそれにかかる時間、及び障害時の動作等について確認しました(右図を参照)。

検証の結果、オンプレミスとIIJ GIOのクラウド間でSRMを利用したDRが正常に動作することを確認できました。ただし、実際のDR環境構築の際にはいくつか注意したいポイントがあります。

1.データレプリケーション時間と必要な回線帯域

今回の検証では、データの初回完全同期時の転送時間は4GB/11分49秒~13分49秒(5~5.6MB/s)という結果でした。また、完全同期後の定期差分同期のスループットもほぼ同様でした。

▼初回完全同期時の転送時間とスループット

Web/APサーバとDBサーバを同時に実行した場合
転送容量 転送時間 スループット
Web/APサーバ 約4GB 13分17秒 約5MB/s
DBサーバ 約4GB 13分49秒 約5MB/s

データ同期間隔に関して、SRMで設定できるのはRPO(目標復旧時点)値のみとなっており、レプリケーション時刻を指定することはできません。そのため、以下を考慮して必要な帯域を算出する必要があります。

  • 全仮想マシンのレプリケーションが重なるケース
  • データの同期をRPO値の間隔内で完了させること

今回の検証環境(データ同期用回線の実効速度:25Mbps)に以下の条件を加えた場合の、同期可能な仮想マシン数を算出してみます。

  • RPO値を15分(900sec)とする
  • レプリケーション対象の仮想マシンはいずれもHDD容量40GBとする
  • RPO値の間隔内での各仮想マシンのデータ差分はそれぞれ400MB(HDD容量の1%)とする

仮想マシン数 ≦ 900sec × 5MB/sec ÷ 400MB ≒ 11台

同様に、「RPO値」「同期したい仮想マシン数」「RPO値の間隔内での各仮想マシンのデータ差分」の値を利用することで、データ同期用回線の帯域幅を算出することも可能です。

2.静止点の必要なアプリケーションやデータベースのデータ

SRMによるデータレプリケーションは、個々のファイル単位での整合性をとることはできますが、複数ファイルで整合性をとる必要があるアプリケーションやデータベースのデータは、フェイルオーバ時に一貫性のある状態でデータを利用できない場合があります。
そのため、静止点が必要なアプリケーションをSRMでデータレプリケーションする場合、アプリケーションのダンプ機能(データベースのエクスポート機能等)を利用し、一貫性のあるデータをSRMにてレプリケーションすることをお勧めします。
フェイルオーバ時はダンプデータからのデータのリストア作業が発生してしまいますが、確実にデータを保護するためには、このような工夫が必要となります。

まとめ

今回の検証では、オンプレミスとIIJ GIOのクラウド間でSRMを使用したDR切替が正常に動作することが確認できました。
これまで、DR環境を構築するような場合は、高機能なストレージを用意しプライマリサイトおよびDRサイトそれぞれに大掛かりなシステムの構築作業が必要で、数ヵ月単位の期間を要していました。
クラウドサービス+SRMの構成は容易に導入が可能なため、複雑な要件でなければ数週間で構築することが可能です。費用対効果の優れたDRサイトを手軽に構築したい場合に、ぜひご検討いただきたいソリューションです。
また、弊社ではSRMを利用したシステムインテグレーションサービスも行っていますので、ご興味があればぜひご相談ください。

(第二事業部 プロフェッショナルサービス部 沓澤)

コメントは受け付けていません。