
有什麼方法可以取得我在 Ubuntu 預設 pdf 檢視器 Evince 中查看的 PDF 文件的字數嗎?我能夠將文檔轉換為文字檔案並從終端獲取字數統計,但我非常希望能夠快速獲取它們而無需使用終端。有沒有任何插件可以做到這一點,或者它已經內建而我只是想念它?
PS 我不想改變我的檢視器,因為 Evince 是 Ubuntu 中預設的 PDF 檢視器,而且我很想盡可能使用預設應用程序,因為其中許多應用程式(包括 Evince)都非常好。
答案1
您可以透過命令列執行此操作:
pdftotext filename.pdf - | tr -d '.' | wc -w
答案2
一個快速的 bash 腳本需要什麼?禪宗和證據。當不帶參數呼叫時,它會給您一個對話框,以便您選擇一個檔案。當使用參數呼叫時(或在所述對話框之後),它會明顯地打開檔案並為您提供一個帶有字數統計的對話框。
換句話說,將以下內容複製到一個名為evince-word-count.sh
或其他內容的文字檔案中,將其保存在路徑中的某個位置(例如,~/bin/
),使其可執行(透過 Nautilus 的右鍵單擊和屬性或使用chmod +x ~/bin/evince-word-count.sh
),
#!/bin/bash
if [ "$#" -gt "0" ] ; then
filename="$1"
else
filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0
現在,右鍵單擊 nautilus 中的某個 PDF,選擇“開啟方式...”,然後使用 evince-word-count.sh 開啟它。現在,當您開啟 PDF 時,它會立即打開,並為您提供字數統計。
答案3
Olaf Leidinger 在 Evince 郵件列表上的回應:
我認為這樣的功能更適合文檔編輯者,因為他們作為普通查看者擁有更多有關文檔的信息,並且計算字數很簡單。以 PDF 檔案為例。您看到的文字實際上可能是某種向量圖形。即使文字本身包含在 PDF 檔案中,您看到的那些單字也可能由多個「在位置 (y,x) 繪製文字」命令組成——例如,在出現元音變音或行尾的情況下。因此,單字可能會被視為多個單字。因此我認為可靠地實現這樣的功能可能很難。看看 pdftotext 就明白我的意思了。
答案4
我不認為這是可能的(技術上是可行的,但尚未實施)。
你必須記住 Evince 是一個文檔觀眾字數統計是一個更通常需要的功能編輯(是的,我知道情況並非總是如此)。
你可能會喜歡聯絡 Evince 開發人員並詢問他們是否有興趣實現此功能。