以前にtwitterでも書いたが、SynologyのDS415+には持病が存在していて、何らかのタイミングでシステムがダウンして起動しなくなる。
原因はintelのCPUエラッタらしいのだけれど、本当のところはよく分からない。
とりあえずDS415+を2台繋いでHigh Availabilityを使用して冗長化していたおかげで、業務に支障は出なかったものの、これがシングルで稼働させていたらと思うと、胃に穴が開きそうだ。
壊れた当時は何が原因なのか分からないから、電源の入り切りだけで対応しようとするし、どうやっても起動しないとなれば、新たにDS415+かそれ相応の機械を購入しなければならない。
そうしたら、新たにRAIDアレイを組みなおして、ネットワークやらアプリケーションの再設定、バックアップからのデータ復元に、数十ものディレクトリのアクセス権限の修復等々…
ダウンタイムは最低でも1日、入手に手間取れば3日ぐらいだろうか…その間通常業務は停滞もしくは大混乱。修復が終わったら終わったで、関係各部署に謝罪行脚。
流石に死ぬほどではないが、終わるまでのストレスは酷いことになるだろう。
運が良ければHDDを壊れた機械から新しい機械に挿入しなおすだけで復旧できるかもしれないが、無理だった時に悲しくなるので、そこは期待しない。
さて、実際の処理を時系列で追いかけてみよう。
・アクティブ側のNASが停止したので、パッシブに切り替えるというメッセージがメールで飛んでくる。
・アクティブ側の電源再投入。 再起動せず。 LEDのエラー表示はその時々で変化するが、最終的に電源ランプが点滅し、ステータスランプは消灯、HDDアクセスランプが全てオレンジ色に点灯した状態で無反応となる。
・仕方がないのでDS918+の購入依頼を提出してから、なんとか修理できないかとインターネットで情報を漁る(この時はまだCPUエラッタが原因とか何も分かってない)。
・平行してsynologyに問い合わせたところ、既に購入から3年以上経過していて、無償修理も不可との事。特定CPU搭載機種の不具合が発生しているという事は把握しているらしく、保証期間は1年間延長されているのだが、通常保証2年+1年ということで、無償修理対象外。
・修理方法は探し方が悪かったのか、なかなか該当する情報が見つからなかったのだが、なんとか台湾の方の記事を発見して、そこから芋づる式に情報を入手する。
ここまでで概ね3日経過。
・日本橋に100Ω(1/8w)を買いに行って、DS415+の修理を実施し、停止前の状態に復旧できた。ここまでで凡そ1週間。
・修理後3か月程パッシブとして稼働させて、問題が発生することは無かったので、アクティブに変更した。
DS415+の分解方法はこちらの記事を参考にさせて頂いた。
本体カバーがひっかかってる爪が無茶苦茶硬いので、マイナスドライバーで抉って、多少フレームを曲げないとカバーが外れない。
抵抗器の取り付け場所は上記の台湾の方の記事や、synologyのフォーラムを参考にした。
現在パッシブ側で使用しているHDDの内の1台が、偶にリードエラーを吐くようになってきたので、まだ上記の故障には至っていないが、予防措置としてHDDを入れ替えるついでに加工しておこうと思う。
※コメント投稿者のブログIDはブログ作成者のみに通知されます