Gostaria de obter todo o texto de um prc
arquivo (sem DRM) no Linux. Existe alguma ferramenta para isso? Descompactar um epub
arquivo é apenas um procedimento prc
, então espero que exista um truque/ferramenta semelhante para prc
arquivos também.
Responder1
O que você está realmente vendo é um formato de arquivo "executável" do PalmOS, que (por razões além da minha compreensão) foi reutilizado como formato de e-book para "Mobipocket". Veraquipara o plano de fundo e uma descrição de baixo nível do formato do arquivo.
Desde que você afirmou que o arquivo de origem énãoDRMed, isso significa que todo o texto está em algum lugar em um formato pronto para ser convertido. Então tudo que você precisa é de uma biblioteca para ler os dados adequadamente.
Meu programa favorito no Linux para converter entre diferentes formatos de e-book (ou totalmente fora dos formatos de e-book) éCalibre- suporta prc
arquivos não criptografados.
Se o Calibre em si não consegue extrair o texto para um formato que você possa usar, e só pode convertê-lo para formatos que você não pode usar, então eu recomendo que você verifique as bibliotecas de baixo nível que o Calibre usa como dependências para ler prc
arquivos. Você poderia então usar o código de exemplo dessa biblioteca para desenvolver uma ferramenta para ler os dados PRC em alto nível, determinar onde está o texto e gravá-lo em um arquivo. Deve ser razoavelmente simples se você for um desenvolvedor.
Essa é uma boa pergunta. +1.
Responder2
KindleDesempacotarfunciona bem. Isso épara download no GitHub.
Veja também:KindleUnpack (MobiUnpack): Extrai texto, imagens e metadados de arquivos Kindle/Mobinos Fóruns MobileRead.