Tenho um e-book que estou tentando ler em formato PDF em um Kindle. Infelizmente, os cabeçalhos e rodapés das páginas têm algum conteúdo (número da página e informações de direitos autorais, respectivamente) impedindo que o dispositivo dimensione o texto real para corresponder à sua área de visualização útil, deixando assim o conteúdo real muito pequeno para ser lido.
Várias ferramentas estão disponíveis para eliminar espaços em branco, mas o Kindle já faz isso; meu objetivo, por outro lado, é remover material impresso fora de uma caixa delimitadora definida, e a única ferramenta que encontrei para esse propósito é um software comercial moderadamente caro.
Provavelmente eu poderia gerar uma máscara no Inkscape; divida as páginas individuais usando pdftk, aplique a máscara a cada página individualmente (emitindo para postscript) e recombine os vários arquivos postscript em um único PDF. No entanto, essas etapas de decodificação/recodificação seriam bastante infelizes em termos de tamanho do documento; algo capaz de operar com um pouco mais de sutileza seria o ideal.
Tenho todos os principais sistemas operacionais à mão (Windows, várias distros Linux modernas, um Mac, etc.), para que as soluções não precisem ser limitadas pela plataforma.
Sugestões?
(Relatei o problema ao autor, que o mencionou ao seu editor, que não fez nada sobre o assunto ao longo de mais de um mês, tornando a abordagem de trabalho zero evidentemente improdutiva).
Responder1
TentarBRISS. Gratuito, de código aberto e multiplataforma. Há uma boa discussão sobre isso emos fóruns do MobileRead.
Responder2
Conforme mencionado em outra resposta, o BRISS é ótimo. Outra ferramenta realmente útil é k2pdfopt (http://www.willus.com/k2pdfopt/). Essa ferramenta é realmente ótima para pegar um PDF e otimizá-lo para o Kindle (ou qualquer dispositivo com tela menor). Funciona muito bem para artigos científicos de 2 colunas, pois reflui o texto enquanto mantém a equação e as imagens.
Responder3
Como já foi apontadok2pdfopté uma ótima ferramenta.
Se você não se importa em fazer o jailbreak do seu Kindle (e possivelmente anular a garantia), também existe a opção de usar essa ferramenta diretamente no seu leitor. Isso é implementado por três forks do mesmo pacote de software:
- Visualizador de PDF Kindleé o original e suporta Kindles com teclado (projetado para Kindle 3).
- Leitor aberto Kindlesuporta dispositivos de toque (Kindles e recentemente também Kobo)
- Bibliotecáriosuporta Kindles sem toque (incluindo Kindle 4)
Eles lidam com múltiplas colunas, permitem refluxo de texto e alteração do tamanho da fonte. Eles conseguem até não destruir fórmulas e imagens científicas durante o refluxo.
Neste momento, existem pequenos problemas, como falta de espaços entre duas palavras de um salto de linha, mas não os considero problemáticos. Talvez eles sejam corrigidos em uma das próximas versões.
Responder4
Eu também tive esse problema com meu PDF digitalizado de 1.200 páginas (não em inglês). Todas as ferramentas, incluindo Adobe Acrobat (IX a XI), não conseguiram cortar o espaço em branco ao redor. A margem da página ímpar diferia daquela das páginas pares. Para piorar a situação, o tamanho da margem era inconsistente. Como@frabjousapontou,Brissajudou. No entanto, quando todas as páginas do documento foram sobrepostas, observou-se que um corte não pode ser aplicado, pois não havia nenhum espaço em branco efetivo geral (devido a margens inconsistentes).
A única solução foi então dividir o documento PDF em páginas individuais, executá-lo no Briss para remover as margens e recombinar. Os passos que segui são:
- Dividi este documento em páginas individuais com Adobe Acrobat IX clicando
Document->Split document
em que abriu a seguinte caixa de diálogo: Esta ação criou 1.200 arquivos PDF individuais. - Então criei um arquivo em lote com o seguinte conteúdo:
for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
- Coloquei este arquivo em lote no mesmo local onde os 1200 arquivos PDF são colocados e executei o arquivo em lote.
- Mais uma vez, usei o Adobe Acrobat IX para juntar todos os arquivos PDF em um único arquivo e pronto, eu tinha um PDF com todas as suas páginas com margens brancas mínimas que agora era muito fácil de ler no tablet.
Dica: No conteúdo do arquivo em lote mencionado acima, basicamente executo um FOR
loop e pego cada arquivo PDF e passo para Briss para cortar automaticamente o PDF. Dependendo
- onde o Briss está instalado (e arquitetura do computador, ou seja, x86 ou x64).
- onde o Java Run Time Environment está instalado.
- O ambiente de tempo de execução Java pode ser baixado gratuitamente emaqui