オルタナティブ・ブログ > 一般システムエンジニアの刻苦勉励 >

身の周りのおもしろおかしい事を探す日々。ITを中心に。

BCP(Baby-care continuity plan)

»

BCP(business continuity plan)と言えば事業継続計画のこと。災害などが発生した際に、いかに事業を継続するかを平時から検討しておくことです。基本的な考え方については内閣府からPDFファイルで事業継続ガイドライン(4次案)というものが配布されています。この2日間で、BCPならぬ育児のコンティニュイティプランも大切なものだと実感しました。

BCPとは情報システムやオフィスのバックアップ体制を整備したり、安否確認ルートなどを定めておくことです。昨日、うちの奥さんが風邪を引きました。夫婦2人での生活ならばよほどの事でもない限りは会社を休んで看病することもないのですが、幼い子供がいるとなると話が変わってきます。昨日は私が会社を休んで家事をしました。オンサイトのバックアップ体制です。インフルエンザなどには効果的ではありませんので、そのような場合は遠隔サイトである奥さんのお母さんまたは私の母に登場願う事になります。

平時の我が家では育児休業中の奥さんが家事を担当し、私は会社に行っています。いざという場合には私が会社を休んで家事をする、ということでアクティブ・スタンバイ構成と言えるでしょう。私の家から会社までは結構距離がありますので、ホットスタンバイやウォームスタンバイとは言えず、コールドスタンバイというのがしっくり来ます。なお、今回の切り替えでは離乳食の時間・量・回数などの点でアクティブ・スタンバイ間での同期が取れていませんでした。知らないところで成長していたんだね。お父さんは嬉しいよ。なんて言ってる場合じゃありません。

仮に2人とも育児休業を取って家事に専念していたら2人で分担してバラバラの事をやりますので、デュプレックス構成と言えます。万に一つの間違いを無くすために同じ家事を2人で相互にチェックしながら担当するとしたらデュアル構成です。(デュアル構成は負荷分散のための構成ではなく、それぞれのシステムの処理結果を突合して間違いが無いか検証するものです)

冗長構成を動かすのに忘れてはならないことがあります。それは、物理的な故障でなくて矛盾したデータやウイルスなどによる障害がおきたときは、そのままスタンバイ機を稼働させてはいけない場合がある、という事です。情報システムが停止する根本的な原因を取り除かないままで停止したメイン機の代わりにスタンバイ機を稼働させても意味がありません。例えばDOS攻撃でメイン機が止まってしまった場合には、攻撃元からのアクセスを遮断するなどの対策を講じてからスタンバイ機への切り替えを行わなくてはなりません。高負荷による障害が再発してしまう恐れがあります。

例えば先日発生した神戸新聞の組版システムの障害はデータベースの矛盾が原因であったとのことです。そのため、予備系システムに切り替えてもシステムを起動することができませんでした。このような障害の場合も冗長構成でも対応できません。神戸新聞の場合は障害前日に取得したバックアップを利用してデータに矛盾のない状態にすることで障害から回復しました。また、ウイルスによりメイン機が停止した場合はスタンバイ機にワクチンなどの対策を施してから稼働させなくてはいけません。

そして我が家の話に戻りますと、私が張り切りすぎたのか、それとも奥さんの風邪が感染性のものだったのか、今日は私も一緒に発熱してしまい、会社を休みました。妻が持ち直してきていたところだったのでフォールバック(縮退運転)で乗り切る事ができましたが、2人とも完全にダウンしていたら奥さんのお母さんに助けてもらわないといけないところでした。昨日の症状を見た感じではインフルエンザではないようだったので、マスクもせずに看病したわけですが、これが甘かったかもしれません。ただし子供はピンピンしてますので感染性の風邪が原因かどうかは確定的ではありません。

そうでないとしたら、張り切って家事をし過ぎました。アクティブスタンバイ構成の場合、スタンバイ機は障害回復までの「つなぎ」にしか利用しませんので、多少性能が劣る機械を入れても問題ないケースもあります。今回の事例では普段の家事と同レベルの負荷で稼働させることを想定した調達仕様になっていない機器を高負荷で運転したことが一因とも考えられます。今後はこのような事態を起こさぬよう注意して参りたい所存であります。

そうすると性能の強化のために普段から家事を手伝っておくというのが正解でしょうか。

Comment(0)