皆様こんにちは。ヴィームソフトウェアの斉藤と申します。
Veeamに関するフォーラム寄稿の第2弾となります。
前回にも記載しましたが、まずは以下4回に分けてトピックをお伝え致します。
・Vol.1 Veeam Software会社紹介とラインナップ+ライセンス
・Vol.2 Veeamのバックアップについて(今回のトピック)
・Vol.3 Nutanix Mine "with Veeam"について
・Vol.4 クラウドやKubernetes環境のバックアップについて
Veeam Backup & Replicationについて
Vol1.でもご紹介しましたが弊社のメインプロダクトになるのがVeeam Backup & Replication(通称 VBR) になります。ちなみに VBR の「R」は「レプリケーション」になりますのでお間違えの無きようお願い致します。
※Commvault社が製品名称を「Simpana」から 「Backup & Recovery」に改称したこともあり
VBRは元々仮想化向け製品でしたが、現在は幅広いプラットフォームに対応しております。
・仮想化基盤(ESXi/Hyper-V/AHV/RHV※1)のエージェントレスバックアップ
・VMware ESXi/Microsoft Hyper-V 環境のレプリケーション
・VMware ESXi/Nutanix AHVのストレージスナップショット作成
・Windows/Linux/Oracle Solaris/IBM AIX/Mac環境のエージェントバックアップ
・AWS/Microsoft Azure/Google Cloud上のエージェントレスバックアップ連携※2
・Oracle RMAN/SAP HANAのPlug-inサポート
※1: 近日GA予定
※2: Veeam Backup for AWS/Microsoft Azure/Google Cloud Platformを利用
Veeam の提唱する「3-2-1」ルール
もはやバックアップ出来ないものは無い、といったくらい多種多様なデータ保護に対応しておりますが、Veeam Softwareではデータ保護に関しての基本コンセプトとして「3-2-1ルール」を提唱しております。
聞いたことがないコンセプトだと思いますが、皆さんが思っている以上にデータは脆い存在のため、しっかりと保護する必要があります。
Nutanix自体がたとえ堅牢なプラットフォームであったとしても、それはあくまでインフラレベルでの話になります。冗長化による物理障害への対策やビットのエラー修正などデバイスに関する保護や修正はもちろん可能ですが、論理的な障害に対してはどうでしょうか。
例えば以下のようなケースはNutanixの力だけで防ぐことはできるでしょうか。
・お客様向け提案書に「AHV」と書くところを「RHV」とTYPOしてしまった
・携帯電話の請求書リンクをクリックしたら、ランサムウェアに感染してしまった
・データベースのトランザクションがコミット中にサーバがダウンしてしまった
ある程度まではNutanixのSnapshotがあれば復旧できそうですが、Snapshotでは保管世代に限りがあるため、場合によっては保管世代すべてがマルウェアに侵されている事もあります。また、トランザクションデータを復旧するためには整合性を確保しておく必要があります。
そういった事から3-2-1ルールでは以下に基づくアーキテクチャを推奨しております。
・3個のデータコピー
・2種類の異なるメディア
・1つの外部保管
3個のデータコピー
バックアップの予備を持つことでバックアップデータの信頼性と投資対効果が飛躍的に高まります。
前提として1日99%の耐久性を持つデータを例として挙げさせていただきます。つまり、1個のデータを保持している場合およそ100日(3か月)で消失するリスクがあるデータとなります。
耐久性を考える上では、確率計算における「余事象」をベースとして計算します。消失する確率(今回は1%)の累乗を100%からマイナスすることで数値が算出できます。
ご覧の通り、2個のコピーを持つことで30年ほどデータの消失を防げることがわかります。非常に良さそうな数字ではあるものの、ビジネスは永続的な活動を行う必要があるため30年では実際には永続的な保管とは言い切れません。
一方で3個のコピーを持つことで耐久性の数値が飛躍的に上昇します。この場合ですと2,700年程の耐久性となるため、1個の追加コピーで90倍ものメリットを享受することが可能となる上に事業継続に必要な永続性がかなり保たれることになります。
2種類の異なるメディア
データの保護をするためには、複製を2個(合計3個)持つことで非常に高い信頼性を確保できることがご理解いただけたかと思います。
しかしながら、複製の持ち方にも留意が必要となります。と、いうのもデータを格納するデバイスにはそれぞれの特徴があり、リスクもそれぞれに存在しています。リスクのないデバイスは残念ながら存在しません。
私は今までのキャリアで2社のストレージベンダに勤務していましたが、2社ともHDDの同時多発障害に遭遇したことがあります。と、言うのもHDDには記憶用の磁性体を回転させるスピンドルを円滑に動かすための「軸受けオイル」を使っており、製造工程の段階で漏れてしまうようなロットが存在することが時折ありました。
このような場合、ストレージアレイを冗長化しようが、HDDによるRAIDを構成したとしても同一ロットを引き当てた場合、突然筐体内のデバイスが全損するような事が発生することがあります。
そう考えると生物が多くのDNAのパターンを持ち、そのまま複製しない方式で世代を継承している理由も納得がいきます。
従って、NutanixによるAsync DRを提案する際も両サイトのプラットフォームの同時障害リスクに備え、複製の複製として別媒体(テープやクラウド)を追加でご提案いただくことをお勧めします。
1つの外部保管
3つのデータ、2種類のデバイスについてご紹介しましたが、最後は外部保管についてになります。正直に申し上げて外部保管については地震大国である日本では言うまでもないリスク回避方法だと考えております。
わかってはいるものの、実際に備えが出来ているかという観点においてはコストの絡みなどもあり、実は未対応だったりすることもあるかと思います。世界的にも実際は82%の企業が復旧するための準備が出来ていないというデータもそれを物語っています。
3-2-1ルールを活用した最適なアーキテクチャ
と、いうことで3-2-1ルールのそれぞれについてご紹介させていただきました。
現在のトレンドを踏まえた上でのバックアップを起点とした「3-2-1」ルールは以下のような構成になります。
本番サイト側でバックアップを取得し、復旧時のRTO (Recovery Time Objective) を最小化するようにします。
そして、バックアップの複製として外部保管をクラウドやテープデバイスを用いて行うことで、本番サイト消失時の災害復旧に備える事が可能となります。
Nutanixの提案としては、Nutanix Mineを絡めた3筐体を用いた構成が良いと考えます。
次回は「Vol.3 Nutanix Mine "with Veeam"について」をお伝えさせていただきます。