在 Evince 中取得 pdf 文件的字數統計

在 Evince 中取得 pdf 文件的字數統計

有什麼方法可以取得我在 Ubuntu 預設 pdf 檢視器 Evince 中查看的 PDF 文件的字數嗎?我能夠將文檔轉換為文字檔案並從終端獲取字數統計,但我非常希望能夠快速獲取它們而無需使用終端。有沒有任何插件可以做到這一點,或者它已經內建而我只是想念它?

PS 我不想改變我的檢視器,因為 Evince 是 Ubuntu 中預設的 PDF 檢視器,而且我很想盡可能使用預設應用程序,因為其中許多應用程式(包括 Evince)都非常好。

答案1

您可以透過命令列執行此操作:

pdftotext filename.pdf - | tr -d '.' | wc -w

答案2

一個快速的 bash 腳本需要什麼?禪宗和證據。當不帶參數呼叫時,它會給您一個對話框,以便您選擇一個檔案。當使用參數呼叫時(或在所述對話框之後),它會明顯地打開檔案並為您提供一個帶有字數統計的對話框。

換句話說,將以下內容複製到一個名為evince-word-count.sh或其他內容的文字檔案中,將其保存在路徑中的某個位置(例如,~/bin/),使其可執行(透過 Nautilus 的右鍵單擊和屬性或使用chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

現在,右鍵單擊 nautilus 中的某個 PDF,選擇“開啟方式...”,然後使用 evince-word-count.sh 開啟它。現在,當您開啟 PDF 時,它會立即打開,並為您提供字數統計。

替代文字

答案3

Olaf Leidinger 在 Evince 郵件列表上的回應:

我認為這樣的功能更適合文檔編輯者,因為他們作為普通查看者擁有更多有關文檔的信息,並且計算字數很簡單。以 PDF 檔案為例。您看到的文字實際上可能是某種向量圖形。即使文字本身包含在 PDF 檔案中,您看到的那些單字也可能由多個「在位置 (y,x) 繪製文字」命令組成——例如,在出現元音變音或行尾的情況下。因此,單字可能會被視為多個單字。因此我認為可靠地實現這樣的功能可能很難。看看 pdftotext 就明白我的意思了。

答案4

我不認為這是可能的(技術上是可行的,但尚未實施)。

你必須記住 Evince 是一個文檔觀眾字數統計是一個更通常需要的功能編輯(是的,我知道情況並非總是如此)。

你可能會喜歡聯絡 Evince 開發人員並詢問他們是否有興趣實現此功能。

相關內容