Como extrair texto de um arquivo prc

Como extrair texto de um arquivo prc

Gostaria de obter todo o texto de um prcarquivo (sem DRM) no Linux. Existe alguma ferramenta para isso? Descompactar um epubarquivo é apenas um procedimento prc, então espero que exista um truque/ferramenta semelhante para prcarquivos também.

Responder1

O que você está realmente vendo é um formato de arquivo "executável" do PalmOS, que (por razões além da minha compreensão) foi reutilizado como formato de e-book para "Mobipocket". Veraquipara o plano de fundo e uma descrição de baixo nível do formato do arquivo.

Desde que você afirmou que o arquivo de origem énãoDRMed, isso significa que todo o texto está em algum lugar em um formato pronto para ser convertido. Então tudo que você precisa é de uma biblioteca para ler os dados adequadamente.

Meu programa favorito no Linux para converter entre diferentes formatos de e-book (ou totalmente fora dos formatos de e-book) éCalibre- suporta prcarquivos não criptografados.

Se o Calibre em si não consegue extrair o texto para um formato que você possa usar, e só pode convertê-lo para formatos que você não pode usar, então eu recomendo que você verifique as bibliotecas de baixo nível que o Calibre usa como dependências para ler prcarquivos. Você poderia então usar o código de exemplo dessa biblioteca para desenvolver uma ferramenta para ler os dados PRC em alto nível, determinar onde está o texto e gravá-lo em um arquivo. Deve ser razoavelmente simples se você for um desenvolvedor.

Essa é uma boa pergunta. +1.

Responder2

informação relacionada