VMware ESXi サーバーが、vCenter から応答不可になりました
VMware のサポートとともに対応を進めていますが、原因が特定できずに、ESXi の再インストールを案内されてたところまで来ていました
わかったこと
・ESXi には、SSH でログオンはできる
・ESXi 単体では正常に動作し、その上の仮想マシンも正常に稼働している
・VMware vCenter Server Agent (VPXA) が起動しない
・hostd は起動している
・ESXi にSSH でログインした後、vim-cmd vmsvc/getallvms で仮想マシンの一覧が取得できない
なるべく、ESXi の再インストールをしなくても良い方法を、独自に仮説を立てて調査を続けてみました
【仮説①】
仮想マシンの一覧が取得できていないことから、「vmInventory.xml の記述に問題がある?」
しかし、以下の理由で、別の角度で調査をすることにしました
・正常に稼働できている仮想マシンもあることから、可能性は低いこと
・vmInventory.xml ファイルの作成し直しには、仮想マシンの停止も必要
【仮説②】
vmInventory.xml で指定している「仮想マシンの設定(VMX) ファイルの中身に問題がある?」
最近、インベントリーに追加したものを中心に、設定ファイルの中身をチェックしたところ、『全角の空白』が含まれていることが判明
そこで、該当の仮想マシンをインベントリーから削除したことで、以下まで復旧できた
・vim-cmd vmsvc/getallvms で仮想マシンの一覧が取得できた
・VMware vCenter Server Agent (VPXA) が起動した
・vCenter と通信可能となった
【結果】
仮説②による作業で、復旧することができました
【考察】
運用上、本来は直接編集することのない設定ファイルに対し、直接編集していたことに起因
その結果、その設定ファイルを使ってインベントリーに追加したことで、VMware vCenter Server Agent (VPXA) が停止し、vCenter から応答不可になった
仮にESXi を再インストールしたところで、不正な設定ファイルをインベントリーに追加し直したら、再発していたことを考えると、、、
VMware のサポートとともに対応を進めていますが、原因が特定できずに、ESXi の再インストールを案内されてたところまで来ていました
わかったこと
・ESXi には、SSH でログオンはできる
・ESXi 単体では正常に動作し、その上の仮想マシンも正常に稼働している
・VMware vCenter Server Agent (VPXA) が起動しない
・hostd は起動している
・ESXi にSSH でログインした後、vim-cmd vmsvc/getallvms で仮想マシンの一覧が取得できない
なるべく、ESXi の再インストールをしなくても良い方法を、独自に仮説を立てて調査を続けてみました
【仮説①】
仮想マシンの一覧が取得できていないことから、「vmInventory.xml の記述に問題がある?」
しかし、以下の理由で、別の角度で調査をすることにしました
・正常に稼働できている仮想マシンもあることから、可能性は低いこと
・vmInventory.xml ファイルの作成し直しには、仮想マシンの停止も必要
【仮説②】
vmInventory.xml で指定している「仮想マシンの設定(VMX) ファイルの中身に問題がある?」
最近、インベントリーに追加したものを中心に、設定ファイルの中身をチェックしたところ、『全角の空白』が含まれていることが判明
そこで、該当の仮想マシンをインベントリーから削除したことで、以下まで復旧できた
・vim-cmd vmsvc/getallvms で仮想マシンの一覧が取得できた
・VMware vCenter Server Agent (VPXA) が起動した
・vCenter と通信可能となった
【結果】
仮説②による作業で、復旧することができました
【考察】
運用上、本来は直接編集することのない設定ファイルに対し、直接編集していたことに起因
その結果、その設定ファイルを使ってインベントリーに追加したことで、VMware vCenter Server Agent (VPXA) が停止し、vCenter から応答不可になった
仮にESXi を再インストールしたところで、不正な設定ファイルをインベントリーに追加し直したら、再発していたことを考えると、、、