web検索とサイト内検索は別物として対処する
Vivisimo Velocityの個別機能について記事を書こうかなと思っていたところで「エンタープライズ向けの検索エンジンベンダー」というワードが目に付いたので予定変更しました(笑)
ここ最近数回にわたってVelocityについてエントリを立てていますが、そもそもは、GoogleMiniが45万程度で導入できる時代に、無料とは言え自社のサイト内検索にYahooやGoogleの検索窓を設置して、結果ページにおいてサイト運営者の思惑が反映できない状況と広告が挿入されてしまう状況は問題あるんでないの?とweb制作とか企画立案をお手伝いさせていただく立場としては思うことが多かったのですね。
検索アプライアンスの導入は当然ながら自社の戦略に沿って検索結果のチューニングは可能ですので、webマスターとしては、
- 検索実行してくれたユーザが目的としていると推測されるページに到達してもらえるよう何かしらの方策が打てる
- そのキーワードについて多くの人が参照している情報を特別扱いして表示できる
こういう手が打てるようになるので、せっかく制作したページの情報をなんとか多くの人に参照してもらうとか、必要な情報・適切と思われるページに直結させてあげるという点で有効に働いてくれるでしょうし、例として検索ワードに対して検索結果がゼロだった物があれば、そのワードに対しての結果ページを作成するというような対策も可能になる訳ですね。
この辺がweb検索とサイト内検索は別物として対処することで、サイト価値の向上とかそういうところに繋がっていくとわたしは考えているのですが、ここでVivisimoを例にしてイントラの情報をインデックス化した場合の流れをちょっと考えてみたいと思います。
Vivisimoでは多くの検索アプライアンスと同様に、以下のような様々なファイル形式、データ形式に対応しており、
- 各種グループウエア
- Word
- Excel
- Powerpoint
- OpenOffice
- RTF
- HTML
- XML
- TAR,ZIP
- Oracle
- SQL Server
- Sybase
- DB2
- MySQL
- PostgreSQL
これら異なるフォーマットの情報をクローリング、インデックス化することで、
- 企業内情報及びweb上の情報収集
- 検索可能化
- 再利用可能な状態
- 使い手に横断的かつ有用と思われる情報ソースの提供
- コメントや投票による情報価値評価
- 相対的な情報価値の向上
↑こんな環境を提供できるようになる訳で、それを整形したり再加工したりする事ができる例として先日「usasearch.gov」の例を紹介させていただきました。(残念ながらいまのところコメントと投票についての公開できるスクリーンショットなどをわたしは持っていないのが残念です、、、、)
今後の流れとして重要だよな、、、と個人的に思うことは、吉川さんのブログでも触れられているように「セマンティックな情報」がポイントで、現存するデータや今後増加していく非構造データに対して、これまた様々なフォーマットの中から適切と思われる結果を得るためには、やはり文書内のデータだけに依存するのではなく、メタ情報などでの補足がやはり必要だと思います。
最後に検索アプライアンスを導入しても、その情報を利用した結果がどのように形になっているのか?を把握できないともったいない買い物になってしまうと思いますので、利用者にとってそもそも生産性アップや、問題解決に役立つ情報がちゃんと存在している事が前提になるという当たり前の事を再認識していただき、不足情報があればそれをどうやって補足していくのか?が鍵になるのではと考える次第です。
ここまで読んでいただくと、サイトのアクセス解析についての重要性をこれまた再認識していただけるのでは、、、と思うのですがさすがに長すぎるのではアクセス解析についてはまた別の機会にエントリ立てたいと思います。