У меня есть PDF-файл, созданный из изображений JPEG, отсканированных в цвете с нескольких страниц.
Размер файла очень большой (> 325 МБ), а у меня нет доступа к оригинальным сканам (у меня есть только PDF-файл).
Можно ли как-то сжать его, скажем, до 25~50 МБ (или хотя бы менее 100 МБ) без значительной потери качества?
решение1
Если вы можете использоватьпрограммное обеспечение OCRна изображениях, чтобы превратить их в текст, после чего можно значительно уменьшить документ.
Если это не помогает или страницы в основном состоят из рисунков, то все, что вы можете сделать, это снизить качество изображений. Либо с помощью специальных инструментов, либо просто сделав скриншот этих нескольких страниц, отредактировав их, а затем распечатав на «PDF-принтере»).
Поскольку документ тольконесколько страницэто можно сделать довольно быстро. Для больших документов это быстро станет обузой.
решение2
Попробуйте использовать7-молниядля сжатия PDF. Метод сжатия 7z обычно дает хорошие результаты.
Чтобы действительно сжать группу изображений, вам нужно сохранить изображения в формате BMP и сжать их как целую группу, а не сжимать каждое по отдельности. Таким образом, они могут совместно использовать «словарь», используемый для сжатия. Однако это потребует довольно много усилий для одноразового файла.