オルタナティブ・ブログ > Randomwalk >

予測できないITの行く先を、あちこち歩きながら考えてみます

エンタープライズサーチのゴールはやっぱりセマンティックWebなのか

»

エンタープライズサーチと似ていると僕が思う分野にビジネスインテリジェンス(BI)があります。

BIは、「今年度のこれまでの売り上げの地域別の内訳は?」とか「おむつと併売率が高い商品は何?」とか、いわゆるサーチではないけれども、膨大な数字やテキストを分析して答えを求めるという点で非常にサーチと類似性が高いように思います。BIは、定型データに限定したサーチといってもいいのかもしれません。

いまインターネットサーチの対象となっている情報のほとんどは、いわゆる文書=非定型データですが、一方で企業内にはたくさんの定型データ(=データベース≒RDB)があります。この点も、エンタープライズサーチとインターネットサーチの大きな違いでしょう。

BIはテキストマイニングなども含めてかなり進化が進んでいるので、例えば「過去3年間の四半期ごとの売り上げと在庫の関係をグラフ化せよ」とか、「利用者アンケートの中で、もっとも言及された競合製品は?」などの想定された質問の範囲ならばかなり的確に答えを出してくれるところまできています。

こういうBIの結果をエンタープライズサーチの検索結果とうまく融合させていくことができれば、有用性はさらに増すように思います。というか、ニーズとしてこの2つの統合は当然の流れなのではないでしょうか。過去1年と今四半期の売り上げのトレンドは? を知りたいときに、エンタープライズサーチで売り上げ報告書を探すのと、BIでデータベース内の数字を探すのと、2つも方法があるより、統合されていたほうが便利なのは明白でしょう。

そう考えると、エンタープライズサーチの1つの理想像として、「四半期の売り上げ予想は?」という質問に、BIなど定型データの分析結果として結果予想と、地域別売り上げや製造計画の進捗といった定型データの分析、合わせて経理による報告書と、担当営業の営業報告書と一連の見積書など関連した文書のリストアップ、といった結果が出るといったものを想像します。

こうした定型データと非定型データの連携はどうすればできるのでしょう。たぶん、データのセマンティック(意味)とかコンテキスト(文脈)とかを理解させなくてはならないのでしょう。つまり、RDBの「顧客」列にある情報と、営業報告書の文書の中の「佐藤電気」と、見積書の「佐藤電気株式会社」は同じ顧客を指す、といった情報の意味と、それがどのような業務フローに基づいて売り上げに結びついていくのか、といった文脈についての情報が必要になりそうです。

前回、検索結果の重み付けのためにタグなどのメタデータを持たざるを得ないだろう、と書いたのですが、ここでもデータの意味づけのためなどでメタデータは避けざるを得ないなあ、という話になってしまいそうです。

コンテキストのことを考えても、メタデータやデータモデル、ビジネスプロセスなどをエンタープライズサーチが包含していなければならいですし、しかもこれらのシステムは当然のごとくマルチベンダーな環境で実現されるでしょうから、メタデータもモデリング言語、ビジネスプロセスの定義も標準化が必要でしょう(UMLやER図やBPMNなど一部使えそうな標準はありますが)。先は長そうですね。

なんだか、最初に自分が考えた以上に話が広がって荒っぽい話になってしまったので、いったんこの辺でたたもうと思います。

これまで、エンタプライズサーチをインターネットサーチと比べながら考えてきたのですが、要するにコンピュータに高度な情報処理をさせるには、ネットであろうと企業内であろうと、どんどんセマンティックWebな方向にならざるを得ないのだろうな、ということで、俯瞰してみると、ネットサーチもエンタープライズサーチも、最後に求められるのはデータの意味や文脈を理解すること。サーチの本質的な進化は相似形なのかもしれません。

Comment(0)