Google検索アプライアンスについて
先週のことになるがGoogleがDELLとの提携の報道が流れた。提携内容はDELLのパソコンにGoogleのインターネットツール群を組み込んで販売することとGoogleアプライアンスのサーバマシンをDELLが提供するという2つを大きな柱にしている。
さて、鳴り物入りで登場しているGoogle検索アプライアンスであるが、期待が大きい反面ファイヤーウォールの中という新しい領域でのGoogleの力は未知数ということを多くの人が述べている。「エンタープライズGoogle「期待の声」と「死角」」にはこのあたりが簡単にまとめられていて参考になる。
さて検索分野でのGoogleが最も売りにする部分は検索結果の妥当性だ。これは言い換えれば検索結果の表示順序が売りということだ。Googleはこの分野ではPageRankというあまりにも有名な技術を持っているが、これがエンタープライズでもインターネットと同じように効力を発揮するかについては、いまのところちょっと疑問である。PageRankはそのページがリンクされている情報を元にそのページの価値を判断する技術が中心だとされているが、現在の日本ではエンタープライズにおける多くのコンテンツは未だWeb化されておらず、こうなるとPageRankは無力である。エンタープライズサーチではリンクが貼られていない文書をどう評価するのかというほうがポイントである。
但しPageRankの優位性には未だにユーザからの根強い支持があり、このGoogleの専売特許が上手く使えれば一発逆転もありうるかもしれない。例えば現バージョンのGoogle検索アプライアンスはノーツ/ドミノ等のファイルフォーマットへの対応を進めてきているようだが、もしこの対応の際にノーツ/ドミノのリンクホットスポットをWebのリンクのように扱えるようになればどうだろうか。
加えて英語圏の検索エンジンは国産のそれに比較すると日本語に弱いという欠点もある。日本語に特化したきめ細かい言語処理表記ゆれへの対応や同義語への対応は未知数である。例えばネット上のGoogleでは「コンピュータ」と「コンピューター」とキーワードの末尾を変えるだけで結果の件数が変わってしまう。「エンタープライズ・サーチ」「エンタープライズサーチ」間でも同様である。利用ユーザ側としてはこれらを同じ意味と理解して両者をまとめて表示して欲しいというニーズは強い。
現在Google検索アプライアンスは、大手メーカの社外向けWebページでの検索などで採用が進んでいるが、確かにこの分野ではGoogleの技術が生きるだろう。膨大な製品情報やマニュアル・FAQなどを掲載したメーカのホームページではコンテンツは全てHTMLで作成されているし、良く使われる情報へのリンクはページ内外を問わず自然に多くなる。Googleの持つ強みの見せ所である。
最後にアプライアンスという提供形態が日本で受け入れられるかということにも注目をしておきたい。私が聞いたところによると、Google検索アプライアンスはブラックボックス化されているそうで、なにかトラブルがあった場合ラックマウント式のサーバごと取り外して新しいマシンと交換になるとのこと。検索インデックスはもともと企業内のコンテンツへのマッピングデータを保有しているだけだから新マシンで再度インデックスのみ全面収集すれば良いという考え方であるが、逆に撤去されるマシンのハードディスクには企業内情報が断片とは言え残っているはずで、これをユーザ企業がセキュリティポリシー上許可するのかには注目だ。