最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Opteron クラスタ停止

2006年05月20日 23時32分41秒 | Weblog
ほとんど内部連絡用だが、4つのクラスタの中で、このマザーボードで構成されているものがあるが、このサーバに異常が発生したので現在停止している。サーバが突然電源が切れてしまう現象が発生する。はじめは熱の問題かと思ったが、空調も良く効いていて他のノードには異常は無い。さらに電圧降下などが原因かと思ったが、やはり他が無事なのでこの可能性も低いだろう。電源かマザーボードかいろいろと原因が考えられるが、結局点検を兼ねて修理に出すことにした。HDD が故障している可能性は低いので、HDD だけ引き出して無事な他のノードに付けることによってクラスタを復活させる予定だ。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする