オルタナティブ・ブログ > 少しでもパラノイアになってみる >

知的好奇心を満たすために、いろいろなことにチャレンジする

大規模サービス技術入門の感想

»

はてなのインフラ関係を説明した良書です。私自身はこのようなサーバ関係に携わっていないため、読んですぐに仕事に使うことができるわけではありませんが、いくつか本質的なことを説明しています。

はてなではいろいろな問題をぶつかったときに古典的な理論を使うことで解決していると記載してありますが、問題解決の本質的なことなのでしょう。古典的な理論で解けてしまったりするものですが、それを利用する方法を知らないため活用できないのでしょう。

はてぶのカテゴリわけにナイーブベイズのアルゴリズムを使用しています。元になっているのはよくスパムメールを排除するのに使用されるベイズ理論です。私はベイズ理論の勉強本を読んだのですが、どうしても理解できませんでした。理屈自体はある程度理解できたのですが、それを活用方法を理解できませんでした(本質を理解していないのでしょう)。

はてぶでは、学習データを1,000件を人が入力したそうです。ベイズ理論では既知の確率を出す必要があるのですが、それは人手で行うのかと目からうろこがぽろっと落ちました。なるほど、最初の既知の確率をどうするのかと根本的なことを考えていたのですが、これでベイズ理論を使う方法が少しわかってきました。

ベイズ理論自体は1700年代の見つかっていますが、スパムメール除去などのフィルタリングで活用され始めたのはつい最近です。これも古典的な理論で対応できる一つの例でしょう。

以前にはてなではばバッドノウハウも集めていると読みました。バッドノウハウとは、"~をやってはいけない"集です。よくノウハウ的な"~をおこなう"がまとめられますが、そこにはやってはならないことが記載されているわけではありません。

やってはいけない事(バッドノウハウ)は結構重要だと思います。なぜならば、素人がノウハウ集があっても失敗するのはバットノウハウ集がないためです。やってはだめなことは大概はやってしまうのです。このため、ノウハウ集も必要ですが、同じレベルでバッドノウハウ集も集めるべきです。他人の失敗の多くは学ぶ要素は多くあるものです。

私は、はてなのサービスで一番使用しているのははてぶの人気エントリーを眺めることです。トップとコンピューター・ITを見て、バイアスはかかりまくっているかも知れませんがIT業界のトレンドを短時間で追うことにしています。少ない稼動でトレンド追えるので重宝しています(後は暇つぶし)。

それ以外のサービスは使っていません。使わない理由はこれといってないのですが、今後は他のサービスを使ってみたいと思いました。

【本】
モチベーション3.0~持続する「やる気!」をいかに引き出すか~の感想
" 「結果を出す人」はノートに何を書いているのか実践編"の感想
"新書がベスト"の感想
グーグル秘録~完全なる破壊~の感想
"デザイン思考が世界を変える"の感想

Comment(0)