検索クエリーからの連想語による、分類・評価の先読み表示
一昨日の日本経済新聞朝刊に、一風変わった情報検索アプローチが出ていたので、紹介がてらちょっとだけ考察。
ソフト開発のキーウォーカーは、インターネットでの情報検索を効率化できる技術を開発した。調べたい単語を入力すると、その単語から利用者が知りたい追加情報を予測し、「価格」や「場所」などの分類項目を自動で設定。サイトを項目ごとに振り分け一覧表示する。
(中略)
例えば「ラーメン」と入力すると、自社開発した人工知能が味など複数の分類項目を設定し、さらに「濃厚」や「まろやか」といった特徴ごとに検索結果を表示する。単語を複数入力してサイトを絞り込む手間を省く。結果は表にまとめる。
検索キーワードとして入力された文字のほうを手がかりに解析を進めて、情報探索の手間を減らそうというアプローチのようで、ぱっとここまで読むとFAST社が「ダイナミックドリルダウン」と呼んでいる技術に近いような印象だ。
記事にある技術では、検索される情報側ではなく検索キーワード側に分析対象の中心を持って来ているのが期待大だと思う。入力されたキーワードをベースに共起関係などから連想される他の語を割り出すのは、gooで「goo キーワードアシストβ」として試行された後に「goo 関連ワード」として実装された機能がそうだし連想検索エンジンreflexa(リフレクサ)も同じコンセプトだといって良いと思う。ただこの連想語の中からさらに分類項目を選んで(たぶん品詞や語句解析によると推測)さらにその分類項目ごとの値を自動設定して検索結果を先読みするというのは、確かにこれまでにない。
分類項目ごとの一覧表示部分というのが、単純に出てきた評価用のキーワードをand条件で繰り返し検索するだけならいまいちだが、ここで何か独自の評価ロジックが入るのだろう。でもそれならば、いっそ辞書内で分類項目となる連想語ごとに評価用の単語を設定しておいてクローリングとインデキシングの時にその部分を抽出&解析したらどうだろうか。さらに精度が上がりそうだが、クローラーの負荷が大きくなりすぎるか・・・
そういえば最近読んだ「ロングテール検索のパターンを見極める」という記事には、ユーザが検索時に入力するキーワードの羅列順に一定の法則がある、ことが披露されていた。デジタルカメラの検索を行ったときの検索クエリーのパターンを分析した結果
60%もの検索が、ブランド名、機種名、「デジタルカメラ(digital camera)」というパターンにあてはまる。
ことがわかったと言うのである。半数以上の人が最初のキーワードにブランド名を並べるといったキーワードの羅列順位などもなにかに使えないかと思っていたのだが、今回の連想語に順番を組み合わせることはできないだろうか。
検索エンジンの検索結果の表示方法や絞り込みのナビゲーションには、まだまだ工夫の余地があると言われていて、実際に今も各社からどんどんといろいろなアイデアが出てくるので見ていて非常に楽しい。
さて、冒頭の記事には
近く同社サイトで無料の試験サービスを始める。検索の精度をさらに高め、集客力のあるサイトに有料提供することで事業化したい考えだ。
とあるが、残念ながらキーウォーカーのサイトには、今回の記事の紹介もプレスリリースも何もない。かろうじて社長のブログにちょっとだけ予告が書いてある程度。無料サービスが始まったらまた試してみたい。