FreeNASシステムエラー
ストレージサーバーをFreeNASで構築し、機嫌良く動作していましたが、ある時からうまく繋がらなくなりました。
FreeNASの良い点の1つは、OSそのものをUSBメモリーに保存できる点です。
ハードディスクと異なり物理的に障害が発生するケースも少ないだろうということで、障害対策はあんまりまじめに考えていませんでした。
一方ストレージはそういうわけにはいきませんので、ZFS上にRAID-ZでHDD4台構成で構築と個人としては贅沢な構成で冗長化し、iSCSIで接続していました。
それで障害発生後FreeNASのWebの管理画面を開こうとしてもできません。
pingしてみても該当IPアドレスに到達できません。
こうなるとOS自体がちゃんと起動していないとしか考えられなく、USBメモリー自体が壊れるのは考えにくいとは思いつつ、コンソール上で何かエラーがでていないか見てみようとしました。
何かエラーがありそうな感じでしたが、コンソール上には大量のデータがばーっと表示されてどこに根本原因があるのかよくわかりません。
ということで、これ以上調査に時間をかけるのも無駄と判断し、過去の設定が消えてしまうと面倒なので再度OSのインストールをアップグレードモードで実施しましたが、結果かわらず。
しかたなく完全新規インストールを実施しました。
そうするとWebのインタフェースは回復し管理可能となりました。
次にRAID-Zの設定が消えてしまわないようにRAIDーZの以前の設定を慎重に回復しました。
そして、無事にWindows側からiSCSIで接続し、中のファイルを問題なく参照できるようになりました。
以上の状況からUSB上のOSファイルに何らかの異常が発生したのが原因という結論になります。
そして再インストールで回復したということはハードウェアの問題というよりは、ソフトウェア的な問題でOSの一部のデータがおかしくなったという推論になります。
ということでUSBメモリーでも壊れることがあるというのが結論で、対策としては、正常動作するUSBメモリーの内容をイメージコピーしておくということが考えられます。
しかし、マザーボード等ハードウェアが壊れた場合には、再度OSのインストールを余儀なくされるわけで、RAID-Zの設定は何とか回復できることがわかった(当たり前といってみればそれまでですが)ことと考え合わせると、わざわざそこまでする必要はないかな
というのが今の所の結論です。
しかし、RAID-Zそのものの信頼性をそこまで信じてよいものかどうかまだ迷いがあるところで、そう考えるとストレージサーバーそのものも2重化すべきかなどと考えますが、たかが個人ファイルにそこまで金をかけるのもやりすぎという感じです。
実際かなり重要なデータに関しては最近クラウドのファイルストレージ容量も増えつつあるなか、そこに置くというのもありですし(ただファーストサーバーの事故のようなことを考えると本当に100%信用できるかは?がつきます。)
ということでデータ保全は個人データでもいろいろと悩ましいところです。