PowerPoint の「比較」機能がなくなってる?! どうしよう??
先日、PowerPoint の「比較」機能を使おうとしたところ、機能自体がなくなってることに気づいて唖然愕然でした。
2つのpptxファイルの相違点を確認するための機能で、一度作ったpptxをコピーして修正、コピーして修正、・・・・と、派生版をいくつも作ってしまったようなときに役立つ機能だったんですが、Microsoftさん、削除することにしたようです。なんでかな~
とりあえず、ないと困るので自作してみることにしました。まあ、Webサービスとしてpptxの比較機能を提供しているサイトは一応あることはある(それもたくさん)のですが、仕事の文書を素性の知れない外部サービスにアップロードするわけにはいきません。
幸い、以前 pptx ファイルをPythonで読んで解析・編集するツールは作ったことがあったので、自作できるんじゃないかなという見当はつきました。
というわけで自作したのがこちらです。
↓
PowerPointファイル比較ツール
Comparing two PowerPoint pptx files to find similar slides
hiro77284/compare-pptx https://github.com/hiro77284/compare-pptx
Pythonスクリプトで、新旧2つのpptxファイルを読んで、ページごとの画像およびテキスト情報を比較して類似したものをこんな感じのレポートとして出力します。
左端の「Original」は新ファイル側のページ、それに対して旧ファイルの中から類似しているページを見つけたら、類似度を計算して Match, High, Low の3階層でリストアップします。
Match:ほぼ完全一致
High:類似度が高いので派生版ページの可能性が高い
Low:類似度は低いものの、派生版ページである可能性もわずかに残る
というグレードです。
黒く見えているのは画像の差分で、完全に真っ黒だったら画像としては完全一致していることを示してます。
PowerPoint はデータ構造の関係で、画像としては完全一致してもそこに含まれるテキスト情報等の細部は不一致の場合があるので、画像とテキストの両方を比較してどちらかが類似していれば類似ページとみなします。
比較機能がなくなってしまったことで困っている方はどうぞご利用ください。
元・IT技術者の開米瑞浩でした。