Evince에서 PDF 문서의 단어 수 얻기

Evince에서 PDF 문서의 단어 수 얻기

Ubuntu의 기본 PDF 뷰어인 Evince에서 보고 있는 PDF 문서의 단어 수를 확인할 수 있는 방법이 있습니까? 문서를 텍스트 파일로 변환하고 터미널에서 단어 수를 얻을 수 있지만 터미널을 사용하지 않고도 빠르게 문서를 얻을 수 있기를 바랍니다. 이 작업을 수행할 수 있는 플러그인이 있나요? 아니면 이미 내장되어 있는데 없어졌나요?

추신: Evince는 Ubuntu의 기본 PDF 뷰어이므로 뷰어를 변경하지 않는 것을 선호하며 Evince를 포함한 많은 응용 프로그램이 정말 훌륭하기 때문에 기본 응용 프로그램을 사용하여 최대한 많은 작업을 수행하고 싶습니다.

답변1

명령줄을 통해 이 작업을 수행할 수 있습니다.

pdftotext filename.pdf - | tr -d '.' | wc -w

답변2

필요한 빠른 bash 스크립트는 어떻습니까?제니티그리고 증거. 인수 없이 호출하면 파일을 선택할 수 있는 대화 상자가 표시됩니다. 인수를 사용하여 호출하면(또는 해당 대화 상자 이후) evince의 파일을 열고 단어 수가 포함된 대화 상자를 제공합니다.

즉, 다음을 텍스트 파일 evince-word-count.sh(예: )에 복사하고, 경로 어딘가에 저장하고 (노틸러스의 마우스 오른쪽 버튼 클릭 및 속성을 통해 또는 를 사용하여 ) ~/bin/실행 가능하게 만듭니다 .chmod +x ~/bin/evince-word-count.sh

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

이제 노틸러스에서 일부 PDF를 마우스 오른쪽 버튼으로 클릭하고 "다음으로 열기..."를 선택한 다음 evince-word-count.sh로 엽니다. 이제 PDF를 열면 evince에서 열리고 단어 수도 제공됩니다.

대체 텍스트

답변3

Evince 메일링 리스트에 올라온 Olaf Leidinger의 답변:

이러한 기능은 문서 편집자에게 더 적합하다고 생각합니다. 일반 뷰어로서 문서에 대한 정보가 더 많고, 단어 수 계산도 쉽지 않기 때문입니다. PDF 파일을 예로 들어 보겠습니다. 텍스트로 표시되는 것은 실제로 일종의 벡터 그래픽 모양일 수 있습니다. PDF 파일에 텍스트가 포함되어 있더라도 표시되는 단어는 여러 "(y,x) 위치에 텍스트 그리기" 명령으로 구성될 수 있습니다(예: 움라우트 또는 줄 끝의 경우). 따라서 한 단어가 여러 단어로 간주될 수 있습니다. 따라서 이러한 기능을 안정적으로 구현하는 것은 어려울 수 있다고 생각합니다. 무슨 뜻인지 알아보려면 pdftotext를 살펴보세요.

답변4

나는 그것이 가능하다고 믿지 않습니다(기술적으로는 가능하지만 구현되지 않았습니다).

Evince는 문서라는 것을 기억해야합니다뷰어단어 수는 더 일반적으로 필요한 기능입니다.편집자(예, 항상 그런 것은 아니라는 것을 알고 있습니다).

당신은 좋아할 수도 있습니다Evince 개발자에게 문의이 기능을 구현하는 데 관심이 있는지 물어보세요.

관련 정보