Solved

Nutanix CE ブートメディア故障時の対応方法について

  • 6 September 2021
  • 4 replies
  • 64 views

Nutanix CEで3ノードクラスタを構成しているのですが、1台のホストのブートデバイスが故障したらしく、復旧方法をご教示いただけないでしょうか?

 

バージョンは2020.09.16を使用しております。

以前2019.11.22の際は、新しいブートデバイスを接続し、インストールオプションで【Repair CVM(Existing data preserved)】を選択すればブートデバイスを復旧できたと思うのですが、2020.09.16も同様の手順でデータ(仮想マシン)は削除されずブートデバイスを復旧可能でしょうか?

 

お手数をおかけいたしますがご教示いただけますと幸いです。

icon

Best answer by smzksts 6 September 2021, 13:58

View original

4 replies

Userlevel 3
Badge +5

CE-2020.09.16では残念ながら、前バージョンとインストーラーの仕組みが変わったことで、ESXiでも利用できるようになった反面、修復インストールが選択できなくなってしまいました…。

3ノード構成であれば

  1. ブートデバイスの壊れたホストのブートデバイスを交換し、別のIPアドレスを指定してクリーンインストール
  2. クリーンインストールしたホストを、新規のノードとしてクラスターに追加
    (ブートデバイスが壊れる前のノードの残骸と合計して4ノード構成と認識される)
  3. ブートデバイスの壊れたノードの残骸を削除
    ncli host rm-start id=<Host_ID> skip-space-check=true

という流れで、1ノード分のIPアドレスは変わってしまいますが、元の3ノード構成に戻る可能性がある思います(※私自身、壊れたノードと同じものを再インストールして再追加したわけではないのですが、別のノードを追加してCEを3ノード構成に修復したことはあります)。

早速ご教示いただきましてありがとうございます。

やはり仕組みが変わってしまったのですね。。。

 

稼働している仮想マシンのバックアップを取得してから、明日4ノード目としてクリーンインストールしてみます。

 

参考までに教えていただきたいのですが、ご教示いただいた手順の2.と3.の実行タイミングは時間を空けたほうが良いでしょうか?

こちらも2019.11.22の際、故障から復旧させたノードを4ノード目に組み込んだ直後に残骸ノードの削除を実施したところ、タスクのステータスが0%から進まず、タスクの削除もできない事象がありました。

 この際は仕方なく全ホストのクリーンインストールを実施しました。

 

お手数をおかけいたしますがご確認いただけますと幸いです。

Userlevel 3
Badge +5

4ノード目を追加した後、Hardwareメニュー上でノードの表示がIPアドレスからホスト名に切り替わった後(=拡張に関連したオペレーションがひととおり完了した状態)であれば、基本的には問題ない認識です。

ただ、私のケースではそもそもの格納していたデータ量が少なかったので、操作の間隔を特別に長く空けたりなどは気にせず、残骸の削除まで行い成功しました。あまり直接的に参考になりそうな情報を持ち合わせておらず申し訳ありません…。

node removal stuck
あたりのキーワードで探すと事象の参考となるKBが出てくるかもしれませんので、ご参考になさってください。
https://portal.nutanix.com/page/documents/kbs/list?filterVal=All

遅い時間までご確認いただきありがとうございます。

大変参考になりました。

Reply