サーバー構築試験でストレステストをしたらSSDが壊れました
こんにちは。匠技術研究所の谷山 亮治です。
今日はサーバー構築試験でストレステストをしたところ、SSDが壊れたことを紹介します。
社内ストレージ・サーバーを構築しています。だいたいできあがったので、「ストレステスト」をしてみました。ストレステストの簡単な方法は「ベンチマークソフト」を動かすことです。今回はストレージ・サーバーなので「ファイルシステムのベンチマーク」の取得を兼ねてベンチマークソフトウエアを動作させることにしました。
ストレージシステムななので、まずはSSD単体のベンチマークを取得した後に、計画しているディスク構成のストレステスト/ベンチマークを行い、テストの結果の比較ができるよう考えました。
ベンチマークテストは、UNIX系/Linux系/FreeBSD系等で広く使うことができるBonnie++を選びました。
ベンチマークはbonnie++をパッケージでインストールした後に、
# bonnie++ -d /tmp -n 128 -u 0
データーはとれましたが、その後、再起動したら起動途中からVGAディスプレイが「真っ赤」になるようになりました。だんだんパーツを外して行き、結局、該当のSSDを取り外したところ正常に戻りました。戻すとやはり「真っ赤」になります。
どういう理由で壊れたのは判りません。ただ、負荷が高くなるとSSDもそれなりに熱くなります。今のところ、排熱が悪くて壊れた可能性を疑っています。
運用に入る前に「障害を顕在化させた」ことはストレステストの目的に適っており、結果としては満足でした。
書き込み上限の都合で、少なからず寿命縮まりますし。。。
「寿命が縮まる」のは、HDDでも一緒なので気にせずにストレス・テストを実施しています(笑。
ちゃんとしたテスト方法を確立することは、とても大切ですよね。今のシステム設計では、サーバーの高負荷状態が長時間に渡り続くので、ベンチマークでへこたれていては使い物になりません。
今回のテストでは「排熱」の為に、大きく作り直すことにしました。