| « 2005年11月5日 | 2005年11月7日の投稿 |
2005年11月8日 » |
東証のダウンは、プログラム修正後の作業指示書に誤りがあったというのが原因のようです(参照記事)。やはり「なーんだ」というような単純ミスでしたね。この前、引用したパターソン教授の論文でも、大規模インターネットサイトのダウンの原因の半分以上がオペミスと言う結果が出ています。結局如何に高信頼性テクノロジーを使おうが、多重化しようが人間がミスをすれば意味ないわけで、そういうミスが出ないような体制とかプロセスを作るのが、基幹システムを稼動している組織の責任だと思います(自分の経験で言えば、都銀系のシステムはそのあたりはかなりしっかりしていると思います)。
ここで、ちょっと気になるのは東証の運用体制で、ひょっとして運用に変更があった時はテストしないでぶっつけということなんでしょうか?要するに今回に限らず運用手順書に記載漏れがあったらかなりリスキーということですね。問題の根はそこにありそうな気がします。
2ちゃんねる情報(とは言え、いかにも内部情報通の人が書いている感じ)なんですが、欧米の証券取引所では本番と同等構成のシステムがテスト用に用意されておりいつでも並行テストできるようになっているそうです(信頼できるソースがないか調査中)。まあたぶんそうなんだろうなと思いますし、そうでなければまずいと思います。
追加(11/8):
日経ITProの記事の方がわかりやすいですね(さすが専門誌)。どうやらビルド(メインフレーム用語で言えばリンクエディット)作業のミスのようです。プログラムを変えたつもりが変わってなくて、古いバージョンのまま動いていて、後になってから問題が顕在化したということのようです。プログラム修正のタイミングと障害発生のタイミングがずれていたので問題判別に手間取ったということではないでしょうか?
ひとつわからない点が、
10月31日のコンデンス処理では、13日に再登録したサブモジュール間の呼び出し関係をシステムが自動検証した結果、これらを別個のモジュールと判断し呼び出し関係を切断した。翌11月1日朝、参加者データ・ファイルを読み込むプログラムが起動したものの、正しいサブモジュールを呼び出せず、読み込みに失敗したため、売買システムは起動しなかった。
というところで、まあ、独自開発の検証ルーチンが勝手に旧モジュールをはずしてしまったということ(だから、本番で0C4例外)のようですが、その段階でエラーメッセージとかは出さなかったんでしょうか?バッチジョブで変なメッセージが出てればとりあえず関係者集まって調査するというのが常識だと思いますが。
いずれにせよ、人間の些細なミスが重なってこのような事態になってしまったという点は変わりはないでしょう。
追加:
いくつかトラックバックが付いた後で何ですが、タイトルちょっと変えました(オペミス→連絡ミス)。最初に見た朝日新聞のソースでは、作業指示書に間違いがあったということで、オペレーターが誤ったコマンドを入力したと解釈したのですが、その後出た日経ITProやITmediaのソースでは、ビルド(リンクエディット)の指示に誤りがあったということが判明。大きく言えばオペミス(=運用ミス)なのでそのままにしておきましたが、やはりオペミス=オペレータのミスと解釈されそうなのでやはり変えることにしました。
ITmedia本体の方にSOA関係の記事を書きました。自分が昔から言ってるSOAという言葉の定義の話で、ちょっとしつこかったかもしれません ^_^; あと、3本書く予定になってますが、これは今までにあまり書いたことがない新ネタで書く予定です。
最近ではさすがにSOAにおける「サービス」はソフトウェア部品であると言う認識が一般化して、ユーティリティサービスの「サービス」や顧客サービスの「サービス」とごっちゃにする人はいなくなってきたと思います。それでも、SOA関係でいろいろな講演を聴いたり、ベンダーさんと話したりする中で判断すると、SOAの厳密な定義については完全に一致していないようです(同じ会社の中でも異なる定義が使われていそうな気もします)。みなさん、SOAの定義が一致しないというのは認識されていて、統一するのはほぼ無理という現状認識のようです。
こういう状態を表すのに英語では"We agree that we don't agree"(「我々は意見が一致しないという点で意見が一致した」)なんて言ったりします。こういう考え方も大事だと思います。意見が一致しないことからスタートして弁証法的に議論を進めていこうということですね。
| « 2005年11月5日 | 2005年11月7日の投稿 |
2005年11月8日 » |
| 日 | 月 | 火 | 水 | 木 | 金 | 土 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 |
オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

顧客に“ワォ!”という体験を提供――ザッポスに学ぶ企業文化の確立
ちょっとした対話が成長を助ける――上司と部下が話すとき互いに学び合う
悩んだときの、自己啓発書の触れ方
考えるべきは得意なものは何かではなく、お客さまが高く評価するものは何か
なんて素敵にフェイスブック
部下を叱る2つのポイント
第6回 幸せの創造こそ、ビジネスの使命