Obtendo a contagem de palavras de um documento PDF no Evince

Obtendo a contagem de palavras de um documento PDF no Evince

Existe alguma maneira de obter a contagem de palavras de um documento PDF que estou visualizando no Evince, o visualizador de PDF padrão do Ubuntu? Consigo converter os documentos em arquivos de texto e obter a contagem de palavras no terminal, mas gostaria de poder acessá-los rapidamente sem precisar usar o terminal. Existe algum plugin que possa fazer isso ou já está embutido e estou sentindo falta dele?

PS: Eu prefiro não mudar meu visualizador, pois o Evince é o visualizador de PDF padrão no Ubuntu, e eu gostaria de fazer o máximo possível usando os aplicativos padrão, já que muitos deles, inclusive o Evince, são muito legais.

Responder1

Você pode fazer isso via linha de comando:

pdftotext filename.pdf - | tr -d '.' | wc -w

Responder2

Que tal um script bash rápido exigindozenidadee evidenciar. Quando chamado sem argumento, você verá uma caixa de diálogo para que você possa escolher um arquivo. Quando chamado com um argumento (ou após a referida caixa de diálogo), ele abrirá o arquivo em evince e fornecerá uma caixa de diálogo com uma contagem de palavras.

Em outras palavras, copie o seguinte em um arquivo de texto, chamado evince-word-count.shou algo assim, salve-o em algum lugar do seu caminho (por exemplo, ~/bin/), torne-o executável (através do clique direito e das propriedades do Nautilus ou com chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Agora, clique com o botão direito em algum PDF no nautilus, escolha "Abrir com..." e abra-o com evince-word-count.sh. Agora, quando você abre um PDF, ele abre em evidência e fornece uma contagem de palavras.

texto alternativo

Responder3

Uma resposta de Olaf Leidinger na lista de discussão do Evince:

Acho que esse recurso é mais adequado para editores de documentos, pois eles têm mais informações sobre o documento como um visualizador simples e contar palavras é trivial. Pegue um arquivo PDF como exemplo. O que você vê como texto pode na verdade ser algum tipo de forma gráfica vetorial. Mesmo que o texto esteja contido como tal no arquivo PDF, as palavras que você vê podem ser compostas por vários comandos "desenhar texto na posição (y,x)" - por exemplo, no caso de tremas ou fim de linha. Portanto, uma única palavra pode contar como múltiplas palavras. Portanto, acho que pode ser difícil implementar tal recurso de forma confiável. Dê uma olhada em pdftotext para ver o que quero dizer.

Responder4

Não acredito que isso seja possível (bem, é tecnicamente possível, mas não foi implementado).

Você tem que lembrar que Evince é um documentovisualizadore uma contagem de palavras é um recurso geralmente exigido em umeditor(sim, eu sei que nem sempre é esse o caso).

Você pode gostar deentre em contato com os desenvolvedores do Evincee pergunte se eles teriam algum interesse em implementar esse recurso.

informação relacionada