Evince で PDF 文書の単語数を取得する

Evince で PDF 文書の単語数を取得する

Ubuntu のデフォルトの PDF ビューアである Evince で表示している PDF ドキュメントの単語数を取得する方法はありますか? ドキュメントをテキスト ファイルに変換してターミナルから単語数を取得することはできますが、ターミナルを使用せずにすばやく取得できるようにしたいです。これを行うことができるプラグインはありますか、それともすでに組み込まれていて私が見逃しているだけでしょうか?

PS Evince は Ubuntu のデフォルトの PDF ビューアなので、ビューアを変更したくありません。また、Evince を含め、デフォルトのアプリケーションの多くは非常に優れているため、できるだけデフォルトのアプリケーションを使用して作業を行いたいと思っています。

答え1

コマンドラインからこれを行うことができます:

pdftotext filename.pdf - | tr -d '.' | wc -w

答え2

簡単なbashスクリプトはいかがでしょうか?ゼニティそして evince です。引数なしで呼び出されると、ファイルを選択するためのダイアログ ボックスが表示されます。引数付きで呼び出されると (または前述のダイアログ ボックスの後で呼び出されると)、evince でファイルが開かれ、単語数を示すダイアログ ボックスが表示されます。

つまり、以下をevince-word-count.shまたは何かというテキスト ファイルにコピーし、パス内のどこかに保存し (例: ~/bin/)、実行可能にします (Nautilus の右クリックとプロパティを使用するか、 を使用しますchmod +x ~/bin/evince-word-count.sh)。

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

次に、Nautilus で PDF を右クリックし、「開く...」を選択して、evince-word-count.sh で開きます。これで、PDF を開くと、evince で開き、単語数が表示されます。

代替テキスト

答え3

Evince メーリング リストでの Olaf Leidinger からの返信:

このような機能は、ドキュメント エディターに適していると思います。ドキュメント エディターは、プレーン ビューアーよりもドキュメントに関する情報が多く、単語数を数えるのが簡単なためです。PDF ファイルを例にとると、テキストとして表示されるものが、実際には何らかのベクター グラフィック シェイプである可能性があります。テキストが PDF ファイルにそのように含まれていても、表示される単語は、複数の「位置 (y,x) にテキストを描画」コマンドで構成されている可能性があります (たとえば、ウムラウトや行末の場合)。そのため、1 つの単語が複数の単語としてカウントされる可能性があります。したがって、このような機能を確実に実装するのは難しいと思います。私の言っていることを理解するには、pdftotext を参照してください。

答え4

それは可能だとは思いません (技術的には可能ですが、実装されていません)。

Evinceは文書であることを忘れてはならない視聴者単語数は、編集者(はい、いつもそうとは限りませんが、私は知っています)。

あなたは好きかもしれませんEvince開発者に連絡するそして、この機能を実装することに興味があるかどうかを尋ねます。

関連情報