最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA サーバ壊れた&復旧

2009年07月21日 23時35分22秒 | Weblog
SDPA サーバ (sdpa.indsys.chuo-u.ac.jp) が突然 Disk の読み書きが出来なくなって、reboot 等も不可能になった。明らかに RAID コントローラか Disk に異常が発生している。手動で reboot したら、やはり RAID コントローラに異常発生しているようなので、緊急措置として他のマシンで再インストールや再設定等を行って、SDPA サーバとして使うことを考えてみた。
しかし、良く考えてみると同種類の Dell PowerEdge 2970 があと2台あるので、試しに RAID 5 の Disk を全部取り替えてみると無事に起動した(やはり Disk ではなく RAID コントローラの故障か?)。SDPA Online Solver の再設定には 1 時間ぐらいかかったが、それでもマシンが1台減っただけで、無事に SDPA サーバが復旧した。購入後まだ9ヶ月ぐらいなのに壊れるのは少し早い。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする