イレイジャーコーディングの比較 - Nutanix ADSF vs VMware vSAN

  • 28 January 2021
  • 0 replies
  • 613 views

Userlevel 3

本記事は2020年2月5日にJosh Odgers氏が投稿した記事の翻訳版です。

原文はこちら。本シリーズの索引はこちら

 

最近の記事で、同じハードウェア上のNutanix ADSFとVMware vSANの実際の使用可能容量を比較しました。Nutanixの方が約30~40%も多くの使用可能なキャパシティを実現していることがわかりました。

 

次に重複排除と圧縮の技術を比較したところ、NutanixはvSANに比べて容量効率、柔軟性、回復力、パフォーマンスの面で圧倒的な優位性を持っていることがわかりました。

 

ここでは、もう一つ、利用に値する価値があり、なおかつ実績も備えた技術であるイレイジャーコーディングについて見ていきます。イレイジャーコーディングは、重複排除と圧縮にさらに加えて、容量の拡大とパフォーマンスの効率化を可能にします。

 

以前の記事で強調したように、「チェックボックス」スタイルのスライドは、容量、回復力、パフォーマンスなどの重要なアーキテクチャー/サイジング上の考慮事項について、誤解を招きがちです。

 

この問題はイレイジャーコーディングにも当てはまります。簡単な例を挙げてみましょう:

 

機能

Nutanix

VMware vSAN

イレイジャーコーディング / RAID56

 

上記の表では、NutanixとVMware vSANでイレイジャーコーディング / RAID 5と6がサポートされていることを示しています。

 

この情報を見ると、顧客/パートナー/VARは、両製品のデータ削減機能は同等か、少なくとも購入やアーキテクチャの決定には重要ではないと結論づけてしまうのではないでしょうか?

 

もしそうだとしたら、様々なとんでもない理由で途方も無い勘違いをしたという事になるでしょう。

 

以下の表は、両製品で現在サポートされているデータ削減の構成を示しています。

 

機能

Nutanix

 

VMware vSAN

 
 

オールフラッシュ

ハイブリッド

オールフラッシュ

ハイブリッド

イレイジャーコーディング / RAID56

 

以前に学んだように、vSAN はハイブリッド構成(Flash + HDD)での重複排除や圧縮をサポートしておりません。イレイジャーコーディングも同様で、ハイブリッド構成はサポートされていません。

 

これにより、ハイブリッドプラットフォームを選択している顧客は、Nutanixを使用することで、同じ、あるいはより少ないハードウェアでより多くのデータを保存することができる可能性が高くなり、その優位性を活用することができます。

 

前回の重複排除と圧縮の比較で説明したように、VMwareからのメッセージは一貫して、ハイブリッド(HDD)層のデータ削減はパフォーマンス上の理由から行うべきではないため、vSANは意図的にハイブリッド構成ではデータ削減をサポートしていないというものでした。このメッセージには信憑性が欠けていますが、これは後ほどこの記事で説明します。

 

次は、イレイジャーコーディングによる潜在的な容量削減がいつ、どこで、どのように行われているのかを詳しく見ていきます。

 

まず、イレイジャーコーディングの各実装がどのようなデータに適用されるのかを確認してみましょう:

 

イレイジャーコーディング

Nutanix

VMware vSAN

書込み / ホット

書込み / コールド

読込み / ホット

読込み / コールド

 

イレイジャーコーディングを検討する場合、それが適用される最初のデータの種別が圧倒的に重要になります。なぜなら、データのストライプ化とそれに続く上書きのプロセスは、計算とバックエンド IOの両方で多くのオーバーヘッドを生みだすからです。これは「ライトアンプリフィケーション」と呼ばれています。

 

「書込み / ホット」のデータにイレイジャーコーディングを適用してしまうと、入ってくるすべての書き込み IO にフロントエンドのパフォーマンス上のペナルティが発生します。例:アプリケーションや仮想マシンから見た際のパフォーマンスに影響がでます。

 

vSANの場合、SPBMを介してRAID 5または6が適用されますが、これはオンまたはオフのどちらかであり、顧客はパフォーマンスか容量効率かの二者択一を迫られます。

 

Nutanix では、イレイジャーコーディング機能を有効にすると、どのデータが EC-X に適しているかが動的に決定されます。判定は、4MB (エクステントグループ) の粒度で、データが「書込み/コールド」であるかどうかに基づいています。

 

以前、「Nutanix Erasure coding (EC-X) はどのような I/O で効果を発揮するのか」という記事を書きましたが、そこでは次のような図を示しています:

この図はハイブリッド構成を示していますが、オールフラッシュでも同じプロセスで処理されます。唯一の違いは、最後のステップ(図の最下部)が適用されないことです。

 

これは、すべてのデータ(文字通り)に対してEC-Xを有効にすることができることを意味します。データが「書込み/ホット」であったり、頻繁に上書きされたりする場合は、EC-Xは適用されません。また、「書込み/コールド」(書き込み中ではないが、積極的に読み込んでいる可能性がある)のデータには、EC-Xが適用されます。

 

Nutanixを使用すると、フロントエンドの書き込みパフォーマンスに影響を与えることなく、EC-Xは適切な(書込み/コールド)データのみに適用され、すべてがAcropolis分散ストレージファブリック(ADSF)によって動的に管理されます。

 

以下の例を見てみましょう。SQLサーバに10TBのデータがあり、1TBがアクティブに書き込み(上書きまたは新規書き込み)され、9TBがアクティブに読み込まれているが上書き(変更)されていないとします。EC-XはVMのデータの90%(9TB)に適用され、最大の容量効率を得ることができます。一方で、イレイジャーコーディングに適さない1TBの書き込みホットデータは、RF2またはRF3のまま保たれて、最適なパフォーマンスを維持します。

 

私がこれまでに聞いたVMwareの主張は、イレイジャーコーディング(RAID5/6)をインラインで適用することで、大量のデータの後からイレイジャーコーディング処理する際に、一時領域として大きな空き容量が必要になる可能性があるのを防ぐことができるというものでした。これにはある程度の妥当性がありますが、vSANはクラスタサイズに関係なく25~30%のスラックスペースが必要とされているため、vSANがイレイジャーコーディングをインラインで行うかどうかに関わらず、この議論はvSANの顧客にとって何のメリットもありません(もしもあったとしても、取るに足らない程度のメリットです)。

 

Nutanixの場合、複数PBのデータを書き込む必要があり、かつクラスタに十分な空き容量や、回復力などを期待していないような極端な状況の場合には、圧縮や重複排除に加えて、EC-Xをより積極的に適用することもできます(簡単に言えばニアライン的な方法で適用します)。

 

こうした状況においてもNutanixのお客様のための妥協のないシンプルで効果的なソリューションであり続けます。

 

ハイブリッド・プラットフォーム上ではデータ効率化を実施しないというVMwareの主張を検証しましょう:

 

Nutanix のイレイジャーコーディング (EC-X) により、50%の巨大なレイテンシのペナルティが付加されるとしましょう。(実際にはこれは正しくないです。先述の通り、EC-Xは適切なデータにのみ動的に適用され、フロントエンドの書込みIOに影響を与えることはありません。) EC-Xを使用しない場合の読み書きの平均レイテンシは2msだとします。

 

これに50%を加えると、平均レイテンシは3msになります。しかし同時に高速なストレージ層(例:NVMeやSSDなど)に、50%多くのデータ(保守的な1.5:1のEC-X比率を想定)を保存できるようになります。50%のデータがSATA(ハイブリッドの場合)でサービスされた場合は、対照的にレイテンシは平均10ms以上になります。

 

この単純な例は、ハイブリッド システムでのイレイジャーコーディングが、(All Flash と同様に)大きなパフォーマンス上のアドバンテージになることを示しています。

 

とはいえ、顧客はコールドデータを大量にホストするユースケースでハイブリッドを選択することが多いです。コールドデータはアクセス頻度が低いですし、たとえパフォーマンスに影響があるとしても、1.5:1または2:1の効率性は、潜在的なパフォーマンス観点のペナルティを受ける価値が十分にあると考えられます。

 

2:1 の場合、同じデータを保存するのに必要なノード数は半分になります! 顧客はイレイジャーコーディングを有効にして、節約したコストの一部を追加ノードに費やしてパフォーマンスを向上させることができます。その上で最終的な正味(NET)での削減と素晴らしいビジネス成果を得ることができます。

 

ドライブ・タイプ(NVMeとSSD)が混在するフラッシュ・システム用のNVMeとSATA-SSDの場合、1.5:1の保守的な比率であれば、SATA-SSDと比較してNVMeが提供するデータは50%増加し、フラッシュやHDDプラットフォームと比較して優位性は低いものの、レイテンシや性能面でのメリットが得られます。

 

いくらかのレイテンシーへの影響があると想定したとしても、これはかなりしっかりした成果です。

 

まとめ:

 

マーケティングスライドやセールスピッチは、両方の製品が同じ機能をサポートしているように表現されているため、非常に大きな誤解を招くことを取り上げてきました。それぞれの製品の実装が、成熟度の観点と実際の世界で提供できる価値の点で格段の違いがあるからです。

 

NutanixのEC-Xは、フロントエンドのIOに影響を与えず、動的に適切なデータに対して最大の容量効率を提供します。

 

これは文字通り、容量効率に加えて性能の良さの両方を兼ね備えています。

 

vSANの顧客は、ブルートフォース式(総当り式)のONかOFFを選択することを余儀なくされています。すべての書き込みIOに対してフロントエンドのIO(パフォーマンス)に直接的にかつ悪い影響がありますし、データセットがRAID5/6に向いていない場合でも適用されてしまいます。

 

加えて、Nutanixでは、イレイジャーコーディングはハイブリッド環境でもサポートされています。そこで稼働しているワークロードは、EC-Xと非常に相性が良いことが多いです。長期アーカイブ、セカンダリストレージ(スナップショット)およびIO要件の低いデータセットなどです。Nutanixがパフォーマンスと容量効率の両方でリーダーであることは明らかです。

 

次回は、Nutanix & vSANがどのようにストレージ容量を拡張できるのかをおさらいしましょう!


This topic has been closed for comments