障害対応に強くなろう(2) 検索力を身に着けて障害の最短解決を目指そう
»
私が編集支援している人気コラムニスト濱田康貴氏のコラムが京セラグループKCCSキャリアテックで公開されました。
興味がある方はご覧ください。
--
こんにちは。株式会社パイプラインの濱田です。
前回は障害発生時の初動に観察力が大事であると述べました。
今回は、観察力とセットで非常に大事な検索力について取り上げます。
「なぜ検索力が大事なのか」
なぜ障害発生時に検索力が大事なのでしょう。決まった作業手順書に従って対応してはいけないのか?という声もあるのは重々承知です。しかし、毎度毎回障害が発生するたびに原因究明もせず同じ手順で"なんとなく"復旧したように見えて、それは根本解決なのだろうかと、私は逆に問いたいのです。
WEBサーバーやDBサーバーをはじめ、あるプロダクトへの機能 非機能に対する期待は非常に大きくなっています。
例えばnginxの機能一覧だけでも、こんなにあるのです。しかも多数のパラメータが設定できるとなると、あらゆる機能すべてから原因究明を行うのは非現実的で、何かしらの絞り込みを行う必要があります。そもそも、WEBサーバーの障害でメールプロキシの機能を最初に疑うことはほとんどないでしょう(絶対ないとは言いません)。
(この続きは以下をご覧ください)
https://www.kcct.co.jp/careetec/column/2020/hamada/syougaitaiou2.html
SpecialPR