
¿Hay alguna manera de obtener el recuento de palabras de un documento PDF que estoy viendo en Evince, el visor de PDF predeterminado de Ubuntu? Puedo convertir los documentos a archivos de texto y obtener el recuento de palabras desde la terminal, pero me gustaría poder acceder a ellos rápidamente sin tener que usar la terminal. ¿Existe algún complemento que pueda hacer esto o ya está integrado y simplemente me falta?
PD: Preferiría no cambiar mi visor ya que Evince es el visor de PDF predeterminado en Ubuntu, y me gustaría hacer todo lo posible usando las aplicaciones predeterminadas ya que muchas de ellas, incluido Evince, son realmente buenas.
Respuesta1
Puedes hacer esto a través de la línea de comando:
pdftotext filename.pdf - | tr -d '.' | wc -w
Respuesta2
¿Qué tal un script bash rápido que requierazenidady evidenciar. Cuando se llama sin argumento, le aparecerá un cuadro de diálogo para que pueda elegir un archivo. Cuando se llama con un argumento (o después de dicho cuadro de diálogo), abrirá el archivo en evidencia y le dará un cuadro de diálogo con un recuento de palabras.
En otras palabras, copie lo siguiente en un archivo de texto, llamado evince-word-count.sh
o algo así, guárdelo en algún lugar de su ruta (por ejemplo, ~/bin/
), hágalo ejecutable (ya sea mediante el clic derecho y las propiedades de Nautilus o con chmod +x ~/bin/evince-word-count.sh
),
#!/bin/bash
if [ "$#" -gt "0" ] ; then
filename="$1"
else
filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0
Ahora, haga clic derecho en algún PDF en nautilus, elija "Abrir con..." y luego ábralo con evince-word-count.sh. Ahora, cuando abras un PDF, se abrirá en evidencia y te dará un recuento de palabras.
Respuesta3
Una respuesta de Olaf Leidinger en la lista de correo de Evince:
Creo que esta característica es más adecuada para los editores de documentos, ya que tienen más información sobre el documento como un visor simple y contar palabras es trivial. Tome un archivo PDF como ejemplo. Lo que ves como texto podría ser en realidad algún tipo de forma de gráfico vectorial. Incluso si el texto está contenido como tal en el archivo PDF, esas palabras que ve pueden estar compuestas de múltiples comandos para "dibujar texto en la posición (y,x)", por ejemplo, en el caso de diéresis o final de línea. Por lo tanto, una sola palabra puede contar como varias palabras. Por lo tanto, creo que podría resultar difícil implementar una característica de este tipo de manera confiable. Eche un vistazo a pdftotext para ver a qué me refiero.
Respuesta4
No creo que eso sea posible (bueno, es técnicamente posible pero no se ha implementado).
Tienes que recordar que Evince es un documento.espectadory el recuento de palabras es una característica que normalmente se requiere en uneditor(Sí, sé que este no es siempre el caso).
Quizás te gustecontacta a los desarrolladores de Evincey pregúnteles si tendrían algún interés en implementar esta característica.