![株式会社匠技術研究所 簡明な情報基盤を構築 匠技術研究所](https://blogimg.goo.ne.jp/user_image/21/85/3bfc5e113e0e2df5940fb9c3ba4eed11.png)
ZFS on Linux 0.6.3の評価を始めました-ZFSが必要な訳
こんにちは。匠技術研究所の谷山 亮治です。
今日は、今週は「ZFS on Linux」の評価に取り組んできたことを紹介します。
ZFS on LinuxはOpenSolarisでオープンソースで開発されていた新設計のファイルシステムです。コンピューターはファイルシステム上に様々なファイルを作り、変更し、削除します。ファイルシステムは、コンピューターを支える基盤技術で、これなしではコンピューターが情報を保管することはできません。
ファイルシステムは情報保護の観点から、ほとんどの場合「実績のある仕組み」と「デフォルトで設定されるもの」を選択し、敢えて冒険はしません。一方、長期間にわたり、使い続けられたファイルシステムは、地道な不具合修正と改良が繰り返され「安定度」の面では比類のないものに育っています。いわゆる「枯れた」システムです。
この10年ほどで、企業内に蓄積される情報は、驚くほど多くなりました。そのきっかけは「写真」「ビデオ」などの高精細化に伴うファイ容量の増大です。そのため「GB(ギガバイト)」から「TB(テラバイト)」のディスクが当たり前の時代で、USBメモリーで128GB、SSDで512G、ハードディスクでは4TBが一般利用でも入手可能な価格になっています。
数百GBのデーターをコピーしたり、移動させたりするには思いのほか時間がかかります。中小企業のファイルサーバーは、TB級を備えることが当たり前の時代です。しかしながら、そのバックアップには時間がかかります。バックアップの容量を減らすために「差分バックアップ」を行いますが、これもまた大変です。「バックアップすべきデーターを探し出す」には、ファイルの変更時刻を見て、前回のバックアップから変更があることを確認することから、全ファイルの変更時間の情報を突き合わせます。ディスク容量が増え、保存してあるファイル数が多くなれば多くなるほど時間の突き合わせに時間がかかり、やがて更新ファイルを見つけてコピーすることが一日を超えます。そうなると、バックアップそのものが成り立たなくなります。
また、Linuxのext4ファイルシステムではディスクやファイルシステムの障害が発生すると、ハードディスク上の論理整合性を確認し、障害があれば修復するプログラムfsckを走らせます。最近の大容量ディスク全体で詳細なチェックを実行すると、とても長い時間がかかり、実用性に疑問を感じます。
このような背景から、歴史的なファイルシステムを使いつつ、大容量のファイルサーバーやバックアップのシステムを構成することは、もはやできない時代になっています。そのため、バックアップに適した機能を備えるファイルシステムを基にした、ファイルサーバーが必須になります。
匠技術研究所ではOpenSolarisに実装されたZFSに着目し、試用を繰り返してきました。OpenSolarisプロジェクトの停止後は、illumosを核とするOpenIndiana、SmartOS、OmniOS等と併せてzfsonlinuxを試用しています。
ZFSは2000年に入り設計・開発されたファイルシステムで、スナップショットの取得や、その保管、保管データーからの復旧を行うことができます。スナップショットは、バックアップと似ていますが非なるものです。ZFSはスナップショットを使って、効率よくバックアップを行うことができる機能まで含んでいます。新開発なので、操作コマンドも解りやすくシンプルです。
Linux上のZFS実装は2013年1月にzfsonlinux/0.6.1がリリースされ「プロダクションレベルに達した」とアナウンスがありました。その後8月に0.6.2がリリース、この6月には0.6.3がリリースとなり、0.6.1から547ものソフトおよびドキュメント等の不具合修正が行われました。これは利用者が増え、不具合の洗い出しが進んだことによるものだと考えられます。
匠技術研究所では、社内ファイルサーバーやバックアップサーバーのZFS化に取り組んでいます。引き続き、紹介していきます。