エンタープライズコラボレーションの今と今後を鋭く分析

ゴミと宝を分ける~企業内検索基盤構築時のポイント(1)

»

 エンタープライズサーチの話題が続くが、ZDNetのインタービューで「役に立たないゴミ情報までをすべて検索できるようにしたところで、情報を探し出すための効率は上がらないだろう。」とコメントしたことへ、いくつか質問をいただいたのでこの場で若干補足したい。
 時には「沢山見つかる」ことは「見つからない」と同じことになる。私自身インターネットでの検索をして結果が沢山出て来すぎて“うんざり”してそこで検索をあきらめることがままある。どうしても結果を入手する必要があって検索結果を順番に表示をしていった際にあまりにも内容のないモノばかりが出てきて“げんなり”して、結局「教えて!goo」や「Yahoo!知恵袋」といったQ&Aコミュニティで質問しなおすこともある。
 エンタープライズサーチの際にも当然こういった状況が起きないように配慮をするべきだと思う。ファイルサーバなどの中間成果物や未完成品のドキュメントを含む企業内のストレージを検索すると、作成途中のものや複製して作成した類似のドキュメントまでがどっと出てくることがある(注:これはこれで類似の派生文書だけを探したいというニーズのケースもあって企業内検索基盤の捨てがたいメリットであることも間違いない)多くのユーザはこういった膨大な数の検索結果を目のあたりにすると、システムで探すことをあきらめて手近な人に「こんな資料ない?」と聞いてしまうのではないだろうか?
 私が企業内検索基盤の構築コンサルを行う際にはこうしたことが無いように、ある程度検索対象を分けられる仕組みとすることをお勧めしている。例えば最終的に完成したドキュメントだけを集めた「最終成果物」といいう別のドキュメントの保管場所を作成しておき、まずはそちらで検索を行い、そこで見つからない場合に「全社のファイルサーバ」からしらみつぶしにたくさん探すというようなことができるように構成するのである。この「最終成果物」という保管場所に情報を入れる際には、その情報の“めきき”というか評価を行うとなお良い。
 ちなみに昔何かの本で読んだが、人間の記憶の整理の方法でもっとも有効なのは時系列順だそうで「いつ頃のこと」というのが記憶想起には最も良いらしい。これを生かす為には検索条件にファイルのタイムスタンプの範囲指定を指定できるようにしておけば良いのだが、残念ながらファイルサーバ上のドキュメントのタイムスタンプは更新日を示すためにあまりあてになりそうにない。後から修正や複製がどんどん行われるからである。したがって一旦タイムスタンプを固定する意味でも「最終成果物」的な保管場所の確保は有効だと思われる。
 他にもドキュメントを「通達・お知らせ系」「ニュース系」「規定集・手続き・マニュアル系」「報告書・仕様書系」といったある程度の分類にわけてそれぞれ別個にインデックスを作成するというのも有効である。例えば人が忘れ物を探すときに、いきなり自宅から通勤手段から会社まで手当たり次第に探すだろうか?そんなことはしないはずである。自分の記憶を頼りにどのあたりに探し物がありそうか、大体の目鼻をつけてから探し始めるはずである。そしてそこで見つからないときに徐々に探索先を広げていくという行動になるはずである。
 企業内検索を導入する際に「横断的になんでも検索できる」ことを主目的としてなんでもかんでもひとつのインデックスに入れることを要求する方がいるが、私はこれはあまりよくない方法だと思う。インデックスをいくつかに分けておき、ユーザが必要に応じてチェックボックスなどでその検索範囲を狭めたり広げたりできることがより便利な企業内検索基盤だと思う。

Comment(0)

コメント

コメントを投稿する