PDF para HTML - conversor em lote - software gratuito E pago mais confiável e preciso?

PDF para HTML - conversor em lote - software gratuito E pago mais confiável e preciso?

Procuro um gratuito ou pago (cerca de 50$/40 libras)LOTEConversor de PDF para HTML para converterdiversosArquivos PDF de uma só vez.

Precisa ser capaz de lidar com imagens vetorizadas e bitmap dentro do arquivo, gerando ambas como jpegs referenciados pelas páginas HTML.

Eu tentei PDF para HTML pago pela iorigsoft - problemas que parecem travar ou simplesmente ficar ociosos, e as coisas que ele realmente converte têm links quebrados - o nome errado é usado para capítulos constituintes como html.

Também tentei o aplicativo de intrapdf.com, mas ele trava perto do início da conversão, de forma consistente.

Atualizar:

intrapdf funciona na minha máquina com Windows XP, mas não na minha máquina com Windows 7. A única falha é com o conteúdo do índice emoldurado html - os gráficos da página não são exibidos na página no quadro - mas se você abrir o quadro apenas em uma nova guia, poderá vê-los. Isso pode ser uma falha do navegador apenas no Chrome.

Esta solução é boa o suficiente para mim - visto que já gastei o dinheiro (gastei antes de perguntar), mas não posso aceitar minha própria resposta, pois isso não funciona no Windows 7.

Olhei para ferramentas de código aberto, mas elas parecem igualmente frágeis ou usam versões antigas de PDF.

Precisa dele no Windows 7 de 32 bits em casa.

Pensamentos?

Responder1

PDF é umnojentoformato de entrada para conversão, então "flakey" é uma regra mesquinha. Alguns arquivos podem ser convertidos com relativa facilidade, mas a maioriavaitem problemas. (Muito resumidamente: um arquivo PDF é uma lista compactada de "mova para cá, produza isto, mova para lá, ...". Se o documento contiverqualquer coisaalém de texto simples da esquerda para a direita - tabelas, imagens, texto RTL, notas de rodapé, etc. - a conversão provavelmente produzirá alguma quantidade de lixo.)

Responder2

Existe um renderizador de PDF baseado em HTML Javascript chamado PDF.js que usa o elemento Canvas. http://mozilla.github.com/pdf.js/web/viewer.html

Está em desenvolvimento, mas pode funcionar para alguns.

Responder3

Eu verificaria se o openoffice/libreoffice possui sinalizadores de linha de comando para conversão.

PDFs são péssimos para o que você está tentando fazer. Há uma grande incompatibilidade no modelo de documento entre como o PDF vê uma página e como o HTML vê uma página. Haverá arquivos PDF que simplesmente não podem ser convertidos facilmente para HTML por nada.

Responder4

informação relacionada