オルタナティブ・ブログ > メタデータが拓くリアルタイムでパーソナルなサービス >

セマンティックの波と情報セーフティネット

CB Summarizer:「意見優先」vs「事実優先」の要約コントロール

»
一昨日のブログでは、CBサマライザを久々に起動し、その基本的な動作、機能を見ました。

Cbsumm_2

左のブルー地の小窓(pane)が、複数文書を入力としたとき、それらのレイアウト(小見出しなど)を解析して、全体を統合した目次を自動生成したもの。

右上のクリーム色バックの小窓が要約結果。省略された部分は「...」で表示しています。

右下の白地の小窓では、要約窓に抽出されたテキストを太字で強調表示しつつ、全体をつないだ全文の窓、となっています。

左下の「要約率の調整」のスライドバーはわかりやすいかと思います。
要約率は、少し表現に迷いましたが「高」が大胆に省略して情報量を重要なものだけに絞り込んだもの、「低」がより多くのテキストを残したもの、を意味します。インターネットブーメラン付属のCBサマライザは、廉価版なので高中低の3段階のみとなっています。
 

フルバージョンの企業向け CBサマライザでは、他にもスライドバーがあり、きめ細かい要約の制御を可能としています。その1つが、「「意見優先」vs「事実優先」の要約コントロール」です。

学会発表したショートペーパーをご覧下さい。

CB Summarizer の′言語的′オプション機能 A ′Linguistic′ Option Control for CB Summarizer

 仕組みの説明はこうなっています:「フレーズ単位の重要度判定の際に、陳述要素の与える正負の重み係数を加減することにより、事実の記述を優先して要約するか意見の記述を優先するかの度合いを制御する。
 何より、論文の下方にある具体例をご覧下さい。 
同程度の要約率指定でも、事実優先 vs 意見優先 でこれほどの違いが出てまいります:

事実優先】
パソコンで日本語を自由に使えるようにしたATOK。・・・「一太郎」は日本語ワードプロセッサのスタンダードとして多くのお客様にご活用いただいてまいりました。「一太郎」以外にも、「花子」、「三四郎」といったアプリケーションソフトにより、オフィス業務一般をデジタルで表現する手段をご提供してまいりました。・・・ジャストシステムもOM, JOSS, CB Serverと、コミュニケーションを強力に支援するアプリケーション、インフラを提供しております。

【意見優先
パソコンで日本語を自由に使えるようにしたATOK。ATOKは、日本語に強いジャストシステムの
礎を築きました。・・・ジャストシステムは、パソコンの歴史と共に歩んできました。今日、オフィスの道具にしかすぎなかったパソコンがコミュニケーション・メディアとして進化しつつあります。この進化は、・・・さらに力強くなろうとしているのであります。
  ------------------------------

 如何でしょうか?
例文は、15年前のものですので、時代を感じさせるかもしれません 。
しかし、事実の表現 vs 意見的な言い回しの違いについては、当時も今も同じ日本語です。
まったく古くないどころか、同程度の重要フレーズ、と認定された際に、事実優先vs意見優先をこれだけ制御できる文章要約エンジンは他には出現していないように見えます。
※私は寡聞にして知らないので、ご存知の方いらっしゃいましたら是非教えて下さい。何語(英語、中国語、、)が対象の要約エンジンでも結構です。



Comment(0)