エンタープライズサーチの普及はタグ付けにありか?
エンタープライズサーチは社内の情報源に「モレなく対応」することがいまの課題で、次に、その情報に重み付けやパーソナライズがくるのではないか、ということを前回のエントリで書きました。
繰り返しになりますが、インターネットでのサーチを振り返って、
1)ディレクトリ型(初期のYahoo!とか)
2)もれなくクロールするロボット型(Altavistaとか)
3)情報の重み付けをするロボット型(いまのGoogleとかYSTとか)
4)パーソナライズ型(個人の検索履歴などを考慮。A9とか、これからのGoogle?)
5)質問に答える型(日本の人口は? あの映画の主人公は? という質問に、URLではなく、答えを教えてくれる賢い検索エンジンとか)
こうした軌跡の中で、いまのエンタープライズサーチは、どうやら2のあたりにいて、これから3、4、5と進化していくのではないかと。
ただ、進化の順番はこの通りではないかもしれません。
企業内の情報をどうやって重み付けする?
ひとまず、企業内の情報を重み付けすることを考えてみます。インターネット上の情報の重み付けには、リンク情報というのが使えました。ほかからたくさんリンクされている情報は、より重要、というのがその大まかな法則。
しかし企業内の情報(例えばRDB内のデータとかWordのファイル)にはリンクや参照情報はほとんど存在しません。たとえ存在したとしても特定の情報(たとえばそれがたまたまHTMLで記述されているとか)に偏ってしまい、使えそうにありません。
でも、なんとか重み付けをしてあげないと、エンタープライズサーチの利用者は、(社内情報が増えるほど)重要でない情報が並んだ検索結果をえんえんと見させられるハメになります。ですからなんとしても、リンク以外の方法で情報の重み付けや、その情報が何を意味するのかを検索エンジンに教える必要があります。
となれば、これはどう考えても情報に対するタグ付けやノーテーションという方法、つまり情報の外部から、その情報の意味や重要さに言及することを実現するしかないだろう、というのが僕の想像。なぜなら、企業内で蓄積される情報にはあまりにも種類が多いため、そのすべてが自己記述可能な(つまり、情報自身が自分の自己紹介情報を持てるような)状態は望めないと想像するからです。
しかも、タグなどの付加情報を書き込むのは従業員でしょうから、ここにスパムが入り込む可能性はほとんどありません。ただし、タグなど付加情報を書き込むインセンティブをどう従業員に与えるか、という課題を、「経営企画室 企画のもと」ブログでは指摘しています。たしかにその通りですね。
いずれにせよ検索エンジンとタグ付けは、本家(?)インターネットサーチでも、まだ別々に存在していて、両方の情報を統合して活用するところまでいっていないので、エンタープライズサーチでこうした機能を実現するのもまだ先の話でしょうね。
パーソナライズのほうが先に実現
一方で4)のパーソナライズのほうが技術的な要素としては見えてきている感があって、エンタープライズサーチではこちらが先にくるような気がします。利用者の現在の肩書きと過去の検索履歴を組み合わせれば、部門長だから売り上げ結果の数字を重要なものとして見せるか、開発担当者だから、製品の開発進捗情報を情報を重要にするか、といったことは、ある程度推測して結果をパーソナライズすることはできそうです。
またそもそも、役職や肩書きごとにアクセスできる情報には制限があるでしょうから、アクセス権によるパーソナライズなどはすでに既存のエンタープライズサーチに取り込まれているでしょう。
重み付けこそブレイクスルーの鍵
Googleが、ページランクという優れた重み付けを実現したことで一気にブレークしたように、エンタープライズサーチでも、いかに正確にかつ手間なく重み付けができるようになるか、がブレイクスルーの鍵だろう、と思うんですよね。
で、その次にはエンタープライズサーチとインターネットサーチの結果も一緒に見たい、なんてニーズが出てくるんじゃないですかね。インターネットとエンタープライズサーチの統合、なんて面白そうです。
という話はおいておいても、エンタープライズサーチの話で僕が次に気になるのは、BIとサーチの関係なんです。それはまた次回に。(実は次のエントリまで含めて、ゴールデンウィークに書きためておいたんですが、もったいぶってます....)