本記事は2021年2月5日にJosh Odgers氏が投稿した記事の翻訳版です。
このシリーズでは、Nutanix AOSが、3ノードクラスタを含むResiliency Factor 2(RF2:データのコピーを2つ保持する設定)を使用している場合に、メンテナンスモード、リブート、障害シナリオにおいて、仮想マシンの完全な可用性とデータの整合性を維持することを学びました。
また、Nutanix AOSとvSAN 7 Update 1を比較し、(vSANが)より高い(SCSI)I/Oタイムアウトの設定、データの完全退避モードを使用し、オブジェクト再構築タイマーを60分遅延からゼロ遅延(つまり、再構築を即時開始する設定)にしたにもかかわらず、vSANは再起動と電源オンオフ(障害)シナリオの両方でI/Oの整合性エラーが発生するという事実を見てきました。
このパートでは、引き続きX-Ray のPlatform Availability, Resiliency and Integrity(プラットフォームの可用性、回復性、整合性)テストを実施しますが、今回はDell PowerEdge r740xd-24ノード(NVMe+SSD)を使用した8ノードのvSAN 7 Update 1クラスタで行います。
このテストの目的は、大規模なクラスタが結果にどのような影響を与えるか、また、vSANが大規模な環境でI/Oの整合性を維持できるかどうかを確認することです。
それでは早速、結果を見ていきましょう。
メンテナンスモード:
(このテストフェーズでは)I / Oエラーはレポートされません。
再起動時:
(このテストフェーズでは)206のI/Oエラーが確認できます。
電源オフ時:
(このテストフェーズでは)56 のI/Oエラーが確認できます。
(テスト結果の)考察:
4ノードのvSANクラスタでの以前の結果と比較すると、小さいクラスタよりも大きいクラスタの方がI/Oエラー数を減らすことができるようです。
これは、仮想マシンオブジェクトがより多くのノードに配置された状況下で、テスト内容が(8ノード構成の)クラスタ内の最初の4つのノードでのみ操作(メンテナンスモード、再起動、電源オフ)を実行するため、理にかなっています。
もし、このテストが(最初の4ノード上のみでの操作ではなく)5から8ノード目を含めてメンテナンスモード、再起動、電源オフの操作を続けていたら、エラー数は4ノードでのテストと同等か、それ以上になっていたと思われます。
次の検証は?
(Nutanix AOSとvSAN/VxRAILを比較した)I/Oの整合性の考察に(より深く)取り組むため、パート7では、より大きなクラスタとFTT2(Failures to Tolerate 2)を組み合わせたテストを行います。
パート1.に戻る