WatsonがTwitterでさらに賢くなるのか
今週はIBM Insight2014というイベントの取材でラスベガスに来ていた。イベントでフォーカスされていたのは「認知」。あのクイズ番組で優勝したWatsonの話題が盛りだくさんだった。
Watsonは自然言語の質問に対して、その文脈を理解して答えを導き出してくれるというもの。機械学習で専門知識を蓄積して利用する。専門知識もまた自然言語のテキストなどでよく、その文章の構造、文脈、意味を理解して答えを探してくれる。
IBMのクラウド上のアプリケーションは、今後ほとんど背後にこのWatsonの技術が付いてくるようで、それこそがIBMのソリューションの優位性になってくる。このWatsonの肝となるのが、知識を学習するというところ。クイズに答えるための知識としてはWikipediaのような網羅的な説明文章が大いに役立っているようだ。
優良な知識というのはWikipediaのような百科事典的なものだけではない。医療の分野であれば論文やカルテ情報、薬に関する情報などだろうし、コールセンター業務でWatsonを使おうとすれば製品マニュアルやカタログ、さらには過去の対応履歴などさまざまなものが考えられる。
IBMでは、そんな知識の1つとしてTwitterに白羽の矢を当てた。イベント3日目のゼネラルセッションで同社との提携を発表したのだ(実際にはこのゼネラルセッションは、取材ツアーのスケジュールの関係で参加できなかったのだけれど)。
すでにTwitterのつぶやきを分析するといったサービスはいくつかある。多くのものはつぶやかれている場所や時間、つぶやかれている文章に含まれる単語の頻度や、単語の意味からポジティブ/ネガティブを判断するといった比較的定型的な分析に止まっている。
これに対して文章そのものの意味を理解するWatsonならば膨大なTwitterのつぶやきを機械学習し、新たな知識ベースにすることができそうだ。それをうまく使えば、いわゆる専門分野の専門知識を補完して、リアルタイム性やトレンドをも把握できるエキスパートシステムになりそうだ。Watsonにある質問をすると「その質問に対する回答はこれこれがもっとも有力そうだけど、最近のTwitterの動向からは新たにこういう説も考えられます」なんて答えが返ってくるようになるのだろうか(想像ですが)。
残念ながら現状のWatsonは日本語の対応ができていない。とはいえ、今回のイベント中に英語に加えスペイン語が加わり、その次の対応言語として日本語とポルトガル語に着手することが発表されているので、日本でのWatsonの活用ももう少しの辛抱かもしれない。とはいえ、日本語の微妙なニュアンスをWatsonが学習するまでには、それなりにハードルはありそうだ。