オルタナティブ・ブログ > ナレッジ!?情報共有・・・永遠の課題への挑戦 >

エンタープライズコラボレーションの今と今後を鋭く分析

Google検索アプライアンスについて

»

 先週のことになるがGoogleがDELLとの提携の報道が流れた。提携内容はDELLのパソコンにGoogleのインターネットツール群を組み込んで販売することとGoogleアプライアンスのサーバマシンをDELLが提供するという2つを大きな柱にしている。
 
 さて、鳴り物入りで登場しているGoogle検索アプライアンスであるが、期待が大きい反面ファイヤーウォールの中という新しい領域でのGoogleの力は未知数ということを多くの人が述べている。「エンタープライズGoogle「期待の声」と「死角」」にはこのあたりが簡単にまとめられていて参考になる。
 
 さて検索分野でのGoogleが最も売りにする部分は検索結果の妥当性だ。これは言い換えれば検索結果の表示順序が売りということだ。Googleはこの分野ではPageRankというあまりにも有名な技術を持っているが、これがエンタープライズでもインターネットと同じように効力を発揮するかについては、いまのところちょっと疑問である。PageRankはそのページがリンクされている情報を元にそのページの価値を判断する技術が中心だとされているが、現在の日本ではエンタープライズにおける多くのコンテンツは未だWeb化されておらず、こうなるとPageRankは無力である。エンタープライズサーチではリンクが貼られていない文書をどう評価するのかというほうがポイントである。
 但しPageRankの優位性には未だにユーザからの根強い支持があり、このGoogleの専売特許が上手く使えれば一発逆転もありうるかもしれない。例えば現バージョンのGoogle検索アプライアンスはノーツ/ドミノ等のファイルフォーマットへの対応を進めてきているようだが、もしこの対応の際にノーツ/ドミノのリンクホットスポットをWebのリンクのように扱えるようになればどうだろうか。

 加えて英語圏の検索エンジンは国産のそれに比較すると日本語に弱いという欠点もある。日本語に特化したきめ細かい言語処理表記ゆれへの対応や同義語への対応は未知数である。例えばネット上のGoogleでは「コンピュータ」と「コンピューター」とキーワードの末尾を変えるだけで結果の件数が変わってしまう。「エンタープライズ・サーチ」「エンタープライズサーチ」間でも同様である。利用ユーザ側としてはこれらを同じ意味と理解して両者をまとめて表示して欲しいというニーズは強い。

 現在Google検索アプライアンスは、大手メーカの社外向けWebページでの検索などで採用が進んでいるが、確かにこの分野ではGoogleの技術が生きるだろう。膨大な製品情報やマニュアル・FAQなどを掲載したメーカのホームページではコンテンツは全てHTMLで作成されているし、良く使われる情報へのリンクはページ内外を問わず自然に多くなる。Googleの持つ強みの見せ所である。
 
 最後にアプライアンスという提供形態が日本で受け入れられるかということにも注目をしておきたい。私が聞いたところによると、Google検索アプライアンスはブラックボックス化されているそうで、なにかトラブルがあった場合ラックマウント式のサーバごと取り外して新しいマシンと交換になるとのこと。検索インデックスはもともと企業内のコンテンツへのマッピングデータを保有しているだけだから新マシンで再度インデックスのみ全面収集すれば良いという考え方であるが、逆に撤去されるマシンのハードディスクには企業内情報が断片とは言え残っているはずで、これをユーザ企業がセキュリティポリシー上許可するのかには注目だ。

Comment(2)

コメント

ゆきち

いくらなんでも、今も単純なPageRankで検索しているとは考え辛いでしょう。実際に、スパム除去などで相当量のアルゴリズムをいじっていると考えられるし、いくらなんでも、オフィスでの文書が相互の引用同士で機能していないことくらいわかっていると思います(実際にデスクトップサーチを使えば、ある程度の機能の確認にはなると思います)。
あと、表記揺れですが、確かに、ネット上のGoogleは「ユーザ(ー)」「コンピュータ(ー)」では、検索件数に差が出ますが、文書のランキングを調整することで、埋もれる程度の物では無いでしょうか。こういう調整をするオプションとかはないのですかね。実際には、件数こそ異なるものの、上位に表示される文書は、それほど違いが無いですね。また、英語にも「colo(u)r」といった表記揺れはあるので、日本語の特有の問題では無いでしょう。

Googleの説明によると、検索結果の表示順には200以上のパラメータを使ってさまざまな工夫を凝らしており、PageRankはその中の主要な項目のひとつに過ぎないようです。これはSEOやSEM関係への説明の際に彼らが言っています。
 したがってPageRankが使えないからといって他の評価ロジックは機能すると思います。ただしこの場合他の元々エンタープライズ向けに開発された検索エンジンもそれなりに表示順については工夫をしているわけです。ですからインターネットほどのGoogleに優位性はないと推測されています。
 同じく日本語での表記ゆれについてもGoogleも考えているかもしれませんが、現時点では永年それに取り組んできたジャストシステムやアクセラテクノロジのほうが今は進んでいる可能性が高いです。
 ただし検索エンジンの精度は利用環境や使い方で大きく異なりますので100戦戦ってどれかのツールが100勝するというわけもないので、注意が必要ですが。

コメントを投稿する