![Cómo extraer texto de un archivo prc](https://rvso.com/image/1325971/C%C3%B3mo%20extraer%20texto%20de%20un%20archivo%20prc.png)
Me gustaría obtener todo el texto de un prc
archivo (sin DRM) en Linux. ¿Existe alguna herramienta para esto? Desempacar un epub
archivo es solo una tarea prc
, así que espero que también haya un truco/herramienta similar para prc
los archivos.
Respuesta1
Lo que en realidad estás viendo es un formato de archivo "ejecutable" de PalmOS, que (por razones que escapan a mi comprensión) se ha reutilizado como formato de libro electrónico para "Mobipocket". Veraquípara conocer los antecedentes y una descripción de bajo nivel del formato de archivo.
Dado que afirmó que el archivo fuente esnoDRMed, eso significa que todo el texto está ahí en algún lugar en un formato listo para ser convertido. Entonces todo lo que necesitas es una biblioteca para leer los datos adecuadamente.
Mi programa favorito en Linux para convertir entre diferentes formatos de libros electrónicos (o fuera de los formatos de libros electrónicos por completo) esCalibre- admite prc
archivos no cifrados.
Si Calibre no puede extraer el texto a un formato que pueda usar y solo puede convertirlo a formatos que no puede usar, le recomendaría que consulte las bibliotecas de bajo nivel que calibre usa como dependencias para leer prc
archivos. Luego, podría usar código de muestra de esa biblioteca para desarrollar una herramienta para leer los datos de PRC en un nivel alto, determinar dónde está el texto y escribirlo en un archivo. Debería ser razonablemente sencillo si eres desarrollador.
Esta es una buena pregunta. +1.
Respuesta2
KindleDescomprimirfunciona bien. Esdescargable desde GitHub.
Ver también:KindleUnpack (MobiUnpack): extrae texto, imágenes y metadatos de archivos Kindle/Mobien los foros de MobileRead.