人の精神面まで加味した、想定外の災害に対するBCPのポイント
今回の地震で想定を越えたのが、大きな揺れそのものに対するものではなく、むしろ揺れたあとにきた電力供給の問題が挙げられる。
これ、地震から100日以上を経たいまも、ある意味まだ完全復旧できていないところでもある。ようは、このあと電力はどう供給され、データセンターなどではどのような運用をすればいいのかは、まだまだ流動的な部分もあるということ。
データセンターでは、もちろん電源のバックアップというものは用意されている。ところが、今回の災害時には、実際にはバックアップ電源装置が上手く機能しなかったり、バックアップできても電源復旧に想定よりも時間がかかりバックアップ電源の燃料が足りなくなるという事態も発生したようだ。
さらに、先日のEMCのBCPに関する記者説明会で指摘していたのは「地震のすぐあとに電力の問題が発生した。その段階では、地震に対する影響度を測りかねている情況で、このあと電力が足りなくなりそうだからシステムをいま止めるべきなのかの判断が難しかった」とのこと。十分に先が予測できていれば、止めるべきかそのまま運用すべきかの判断はできるが、地震直後で情報が十分に掌握できず、動かすべきか止めるべきかの判断材料がないなかで決断を迫られたと言うことだ。
また、再開、復旧時の問題として浮上したことに、復旧のためになかなか現場に赴けないというのもあったようだ。また混乱している情況では、復旧までの手順やスケジュールが不確定で、結果的にそういったことが担当者の精神的な負担にはテンしていたとのこと。この担当者の精神的な負担というのは、BCP策定の際には忘れがちな事柄では内だろうか。
さらに、うまくバックアップのシステムに切り替えができたところでも、長期間バックアップシステム側で運用することは想定外で、バックアップのままいつまで運用すればいいのかという新たな課題を抱えたところもあったようだ。また、本番環境が全面的復旧したとしても、バックアップから本番に戻すというのもじつはリスクとのこと。多くの場合、本番とバックアップの切り替えといったことは、十分にテストができているものではないからだ。
EMCの説明会では、今回の災害を受けBCPの見直しに着手するところがすでに出てきているとのことだった。災害のシナリオパターンが少なかったところでは想定されるシナリオの追加を、バックアップサイトの場所が適切でなかった場合の検討、人が行けないときに在宅での対応方法の検討、運用面では早急な災害対策の訓練などが見直しのポイントとして挙げられていた。さらにポイントとなるのが、いかにして災害対策を自動化できるかということ。復旧に人が介在すると、災害直後の混乱した情況ではなかなか機能しないことも出てくる。さらには、人がやらなければならないと、先に指摘したように慣れていないために作業には相当なプレッシャーが伴うとのことだ。
災害対策はやろうと思えば際限がない。起こるか起こらないかわからないことにどこまでコストをかければいいのかの判断も難しい。お金をかけた立派な仕組みも大事だけれど、それを運用するプロセスはもっと大事だということも今回わかった。企業は東日本大震災を受けて、人の精神面も含め日頃からどうしたらいいのかを、早急に考えBCPの見直しをする必要がありそうだ。