今日は私が主催しているICT勉強会を紹介させて貰いたいと思います。
主催といっても、基本的には私が声を掛けただけであり、各自色々な企業や職種上の立場は置いといて、自由な立場でICT業界について色々勉強しようという趣旨の勉強会です。
集まったメンバーは各々が通常は業務があり専門分野は持っていますが、取り上げているテーマに関しては素人という事が前提。基本はブレスト的に進行します。「それは違うよ!」という否定や、「わかってないなー」的な高圧的な意見は排除し、エンジニア同士が意見を気兼ねなく交換出来る場があっても良いかなという趣旨で開催しています。
専門家の方から見れば初歩的な見解を述べているかもしれませんし、基本は「勉強会」ですので、誤った事を述べている時もあるかもしれません。そういった時には是非ご指導頂ければ幸いです。
■自律型システムとは?■
自律型システムとは一般的に人手を介さずに障害検出や、自己修復を行う仕組みを持ったシステムの事を指します。2001年位にも一時ブームになりましたが、現在はそれほど耳にしなくなりました。しかし、最近はクラウドの流れもあり如何に運用コストを削減するかという点で再び注目を集めてきている分野です。現在では一部高度なシステムでは実用化されているケースもあるようですが、この勉強会では今ある機器や運用方法を改善する事によって、現状どのレベルまでなら一般企業等でも実現可能な自律型システムに近づけるのかを検討してみたいと考えています。
幸いにも「自律型システム構築勉強会を開催します!」とTwitterで声を掛けた所、Ciscoさんや、キャリア系iDC関係者の方々やSierの方から興味有りとの返事を頂いたので、Ciscoさんのご好意で会議室を提供して頂き、早速各自集まって第一回ミーティングを行いました。
そこで、いきなり壁にぶつかったのですが、みなさん「自律型システム」というキーワードに対してどうやら異なるイメージを持っているようだという事が判明致しました。
確かにネットワーク屋さんと、サーバ屋さんと、アプリ屋さん、更には利用者側の視点では、何を持って自律とするのかは違うのかもしれないね!という結論になり、とりあえず、宿題として「俺が思う自律型システム」をプレゼンしようという話で第一回目は解散となりました。解散というものの、一部のメンバーは朝5時まで飲んでましたが(笑)
■私の考える自律型システム(勉強会で検討したいと考えている範囲)■
というわけで、言い出しっぺは必ず実行しなければならないという人間界の「言い出しっぺの法則」にのっとり、私の想いを発表してみたいと思います。
基本的な発想としては、夢を語ってたら自己満足大会で終わってしまう。如何に「これなら出来るかも?」というレベルに近づける事が出来るかを前提に考えています。
リファレンスになる物はあるかな?と思って探してみた所、IBMさんのオートノミックコンピューティングが、まさにそれといった感じです。
IBMさんの提唱するオートノミックコンピューティングとはこういう事をしてくれるシステムのようです。
・複雑さを「管理」します
・自分自身を「理解」します
・継続して自己を「調整」します
・予測できない事態に「適応」します
・故障を未然防止し、「回復」します
・安全な環境を「提供」します
そして、それらを実現するために、この四つの構成要素から成り立つようです。
自己構成
環境の変化にダイナミックに適応します。
自己修復
システムの中断を防止するために、不具合を発見・診断し、修正します。
自己最適化
IT資源を最大限に利用するために、資源を調整したり、負荷分散したりします。
自己防御
予見や検知、識別を行い危険に対処。また、攻撃に対する防御を行います。
私の考えていた範疇は自己修復があてはまります。自己最適化、自己防御、自己構成については次のステップで良いかなと考えています。他の三つも大変興味深い内容ではあるのですが外しました。あくまでも任意で集まる勉強会であり、あまり多く詰め込んでしまうと、意見が発散しすぎてしまいグタグタになりそうかなという懸念もありますので。
①従来型システムの課題
- 基本は「壊れてから切り替わる」
②自律型システムで改善するポイント
従来型システムの課題を改善する = 壊れる前に切り替わる
方法:従来人的に行ってきていたシステム監視を自動化し、システム異常時検出時に未然に待機系に切り替える。
実現によって期待する効果:
・障害時間の短縮
→未然に切り替わるケースにおいては停止時間0秒
・運用者の負河を軽減可能
→他の業務を行える。
→一人辺りで管理可能なシステム台数が増加する。
・運用コスト削減
→24時間365日の保守から センドバック対応へ変更
→作業効率アップによる間接コスト削減
③対象とするシステムトポロジー
シンプルなWWWシステムを対象としてみたいと思います。このトポロジーにおいて物理障害が発生する前に切り替わるロジックを検討してみたいと考えています。

④検討したい内容
・障害検出方法
・事前切り替えの方法
・障害通知方法
・正常性の確認方法
・どこまで実現可能か?
・解決すべき課題は何か?
■興味のある方はお気軽にお問い合わせ下さい■
基本は難しい事を抜きにした、エンジニアの交流の場とした勉強会ですので如何に同意出来る方はお気軽にご参加下さい。
お問い合わせは私のtwitterかtakashi.ohmoto@gmail.comまでご連絡お願いします。
会則
- 技術に興味がある
→基本ですね、経験の有無は問いません。前向きな方はドンドンご参加下さい
- 積極的に議論に参加頂ける方。
→情報収集も大切だと思いますが、情報収集目的の方達ばかりだと、勉強会ではなく発表会になってしまいます…
自分の技術を自慢する場では無いですし、誰かの知識をけなす場でもありません。
気になった事はどんどん発言し、積極的に議論にご参加下さい。
- 勉強会の資料等は全てウェブ上で公開される物とお考え下さい。
→機密情報等は持ち込まないようにお願いします。
- 営業目的ではない
→営業だけが目的の方はご遠慮下さい。
- 企業の立場は気にしない
→お客様になる方、メーカの方、SIerの方と様々な立場ですが基本は無礼講で。


オンライン会議は無駄を省く
富士通社長が語るICTベンダーとしての心得
求む、クックパッド男子
37歳の常識――我々は一生学び続ける
“コステロ”じゃないよ“コストロ”だよ