ITmedia 総合 | ITmedia News | ITmedia エンタープライズ | TechTargetジャパン | ITmedia エグゼクティブ | ITmedia +D PC USER | ITmedia +D Mobile | ITmedia +D LifeStyle | ITmedia +D Games | ITmedia ショッピング | ITmedia オルタナティブ・ブログ | ITmedia キャリア

Alternative BLOG navi

カレンダー

2009年12月



1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

2006/11/16

検索できないPDFファイル

アプリケーション
 
テクノロジー
 
ビジネス
 

 以前、必要に迫られてGoogle Miniをテストする機会がありました。当時のプロジェクト人数からすると、Google Miniなんか要らないんじゃないかと思う規模でしたが、整理が苦手なメンバーが集まると(苦笑)、あっても良いのかな、というのが発端です。
 ところが調べだしてみると、一部のPDFファイルの検索ができません。「???」と調べていくうちに分かったのは、Acrobatで返還したPDFファイルと、その他のソフト、フリーソフトなど、変換ソフトによって圧縮方式が違うということでした。
 圧縮方式が違うため(あまりよく理解していませんが・・)、検索できるものとできないものがあるそうで。もっとも、圧縮が目的で検索など考えていません、というのかも知れませんが、個人的には検索できないファイルって困るなぁ、と思います。
 PCの中、あるいはファイルサーバの中身は、基本的に全て検索できるべきではないか、と思うのです。
 Googleデスクトップを頻繁に活用している今日この頃、ふとこんなことを思い出しました。

kumaboo

この記事をソーシャルブックマークに保存しませんか?

コメント

2006/11/16 12:20

PDFファイルって、変更できないのが特徴のファイルという認識がありました。PDFファイルの内容って画像と一緒という意味で受け取っていたんです。
でも、文字を検索できるようにと、どうも「透明な文字を画像の上に貼り付けている」と聞いたことがあります。
この透明な文字で検索が可能になるようなので、ツールによっては、この透明な文字を貼れるものと貼れないものがあるようなんです。
しかし、PDFファイルをExcelやWordに変換できるツールの出てきており、PDFの変更不可能という特徴が薄れてしまっていると思います。
ただ、もう一つの特徴で無料のAcrobatReaderさえあれば中身が見れるという特徴は健在のようです。

2006/11/16 13:28

>Kawakamiさん
そうなんですよねぇ。
どのツールで変換したものも、AcrobatReaderで開いたら、その中を検索することはできるんです。
ただ、ファイルの状態で開かないで検索することができないものがある、ということなんですよね。

tmiyoshi
2006/11/18 13:40

PDFが画像だけ、というのは間違いです。また変更できないファイルというのも間違いです(変更不可の制限をかけて作られたファイルを除く)。透明テキスト、というのは例えばFPU製のscan snapではscanしたものをOCRして透明テキストとして画像の上に配置することで、見た目を変えずに検索できるようにしていますが、そのようなやり方でPDF化したファイルに限定されたもののはずです。

コメントを投稿する






オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

トラックバック

トラックバックURL:

http://app.blogs.itmedia.co.jp/t/trackback/77444/6641900

トラックバック・ポリシー