オルタナティブ・ブログ > メタデータが拓くリアルタイムでパーソナルなサービス >

セマンティックの波と情報セーフティネット

サマライズとは?→把握・理解に要する時間の短縮!

»
 
Cbsumm
 同じ絵に再び登場願います。CBサマライザの3-paneサマライズ表示です(左図)。
 この出力形式のデータ量(総バイト数)は、原文テキスト量と比べてどうなっているでしょうか?
 右下の「強調表示付き原文」をみただけで、原文テキストの量を上回っていることは明白です。あと、表示されるテキスト量でいえば、右上の「要約窓」には、原文テキストに要約率をかけたデータ量+α(省略部分を表す「 ... 」や、改行など、見やすく把握していただくためのレイアウトのために文字コード量が若干増加します。
 加えて、左の「串刺し目次窓」に採られた、原文中の見出し類らしき行のテキストがあります。そして、全体として、HTMLのタグ類(右下窓の強調表示のための<b>タグなど)が加わります。
 
■サマリーなのに、テキスト量は2倍前後に増加している!
 →これが解答です。
 従来の学会等でのサマライズの定義では、テキスト量は減るもの、と相場が決まっていました。しかし、CBサマライザでは、テキスト量は増えています。では、何が著しく減ったのでしょう。
 このソフトを設計した私の考え、狙いでは、読者の、対象文書群の要点の把握・理解に要する時間が削減されます。
 
 実際、ある部門の部長さんに頼んで、外出の30分前に、
目を通さねばならない100本の文1 書をCBサマライザにかけて読んでもらいました。横で観察してましたら、まず、左の青いまどのスクロールバーをクリクリとマウスで動かし、何か見つけたらその行をクリック。瞬時に右上の要約窓が出てきて、こんどは、そこを、注目箇所の前後数カ所に、目を通しました。そんな風に10数回手を動かした中で、2回だけ、右上窓の省略箇所の前後をクリックして、右下の、強調表示付き「串刺し原文」にも目を落としました。
 
 そして、読み始めて15分。やおら「よし、わかった!有り難う!」とニッコリ笑い、ゆったりと外出の準備をしながら、見つかった2本の文書を数部ずつ印刷してクリップ止めし、出かけていきました。「把握・理解に要する時間の短縮することを目的としたCBサマライザ」が成功したことを確信した瞬間でした。
 意地悪くいえば、右下の強調表示付き原文があることで、2 「全く欠落してしまった部分」が無いことが保証でき、仮にサマライズの精度がイマイチでも文句を言われない保険となります。しかしながら、最も保守的なユーザであっても、右下の強調付き全文表示窓を拡大してもっぱらそこを読み、太字表示を目で追う、という新しい読書スタイルを身につけ始めました。生真面目な性格がたたってか、それまでは、速読の類はいくら挑戦しても失敗していたとのことですが、システムが視点をうまく誘導してくれれば、何の苦労もなく速読できる、と。
 
 ある保険会社さんでは、検索と串刺し要約の読み込みを数分に1度ずつ繰り返す、というスタイルで1000文書の重要ポイント全部に1時間以内に目を通せた、などのご報告がありました。「安心感が得られた」、「自分が賢い人間になった気分」、「残業が減りそうな気がしてきた」などの感想を聞いて嬉しくなったのを覚えています。
Comment(0)