Cómo extraer texto de un archivo prc

Cómo extraer texto de un archivo prc

Me gustaría obtener todo el texto de un prcarchivo (sin DRM) en Linux. ¿Existe alguna herramienta para esto? Desempacar un epubarchivo es solo una tarea prc, así que espero que también haya un truco/herramienta similar para prclos archivos.

Respuesta1

Lo que en realidad estás viendo es un formato de archivo "ejecutable" de PalmOS, que (por razones que escapan a mi comprensión) se ha reutilizado como formato de libro electrónico para "Mobipocket". Veraquípara conocer los antecedentes y una descripción de bajo nivel del formato de archivo.

Dado que afirmó que el archivo fuente esnoDRMed, eso significa que todo el texto está ahí en algún lugar en un formato listo para ser convertido. Entonces todo lo que necesitas es una biblioteca para leer los datos adecuadamente.

Mi programa favorito en Linux para convertir entre diferentes formatos de libros electrónicos (o fuera de los formatos de libros electrónicos por completo) esCalibre- admite prcarchivos no cifrados.

Si Calibre no puede extraer el texto a un formato que pueda usar y solo puede convertirlo a formatos que no puede usar, le recomendaría que consulte las bibliotecas de bajo nivel que calibre usa como dependencias para leer prcarchivos. Luego, podría usar código de muestra de esa biblioteca para desarrollar una herramienta para leer los datos de PRC en un nivel alto, determinar dónde está el texto y escribirlo en un archivo. Debería ser razonablemente sencillo si eres desarrollador.

Esta es una buena pregunta. +1.

Respuesta2

información relacionada