Почему при печати изображений в формате PDF я вижу пикселизированный текст?

Question 1

Причиной низкого качества ваших файлов PDF является ваше непонимание разницы между векторными и растровыми изображениями в сочетании с внутренними особенностями формата файла PDF. Это приводит к неподходящему производственному процессу, который не дает желаемого результата.

Растровые и векторные шрифты

История компьютеров началась в мире растровых изображений. Символы были представлены растровыми изображениями, также называемыми «растровыми картами». См. следующий растровый шрифт Atari:

https://fontmeme.com/fonts/atari-font/

Технический прогресс в плане вычислительной мощности и хранения данных позволил более красиво представлять символы с помощью так называемых векторных шрифтов, которые, например, описывают букву «d» примерно как круг, пересеченный прямой линией.

Векторные шрифты можно масштабировать до размеров вселенной без потери качества. Растровые шрифты, независимо от того, сколько ресурсов они потребляют, можно масштабировать до уровня, на котором вы увидите квадратные пиксели.

Внутреннее устройство форматов файлов Adobe PDF

Формат файла PDF позволяет смешивать различные типы объектов, например, растровые изображения с использованием различных типов сжатия, а также векторные шрифты.

Схемы сжатия потерь не подходят для текста

Такие схемы сжатия, как JPEG или JPEG2000, алгоритмы которых реализованы в формате PDF-файла, не подходят для текста, поскольку их типичный режим применения с потерями создает артефакты сжатия, которые легко видны.

Неподходящий процесс создания PDF-файлов — печать на виртуальном PDF-принтере

Вероятнее всего, ваш источник распаковывается при печати, предоставляя принтеру гигантское растровое изображение, которое повторно сжимает это растровое изображение с потерями, используя схему сжатия, которая хороша для изображения, но не подходит для текста.

Вы можете не заметить эту потерю качества на отсканированном изображении, но вы заметите ее, взглянув на текст.

Решение 1

Либо попробуйте последовать совету Дэниела Б. и увеличьте качество сканирования, распечатайте его в высоком разрешении и убедитесь, что настройки принтера не сжимают изображение слишком сильно.

Решение 2

Другой способ — использовать редактор PDF, в котором вы включаете изображение как файл JPEG с потерями, а текст как файл PNG. Таким образом, ваш редактор может сохранять оба элемента (текст и изображение) отдельно в файле PDF и не использует одно единственное растровое изображение, как принтер PDF.

Затем ваш PDF-файл будет декодирован двумя движками: DCDDecode для изображения и JBIG2Decode для текста, см. раздел «растровые изображения» в статье. https://en.wikipedia.org/wiki/PDF

Решение 3

Если это не соответствует вашим ожиданиям, вам нужно будет отсканировать текст отдельно с самым высоким доступным вам оптическим разрешением. Затем вам нужно будет выполнить OCR и позволить какой-то программе угадать исходный тип шрифта. При необходимости вам нужно будет вручную исправить тип шрифта.

Помните о процессе производства вашего сканирования: есть высококачественное растровое изображение и векторный шрифт, используемый издателем. В процессе печати текст преобразуется в высококачественное растровое изображение с использованием векторной информации. Я полагаю, что это может быть до 2540 точек на дюйм.

Ваше сравнительно слабое сканирующее оборудование может обеспечить оптическое разрешение лишь в 600 точек на дюйм, что уже отражает потерю примерно 50% как по оси x, так и по оси y.

Надеюсь, это прольет свет на вашу проблему!

Answer

Причиной низкого качества ваших файлов PDF является ваше непонимание разницы между векторными и растровыми изображениями в сочетании с внутренними особенностями формата файла PDF. Это приводит к неподходящему производственному процессу, который не дает желаемого результата.

Растровые и векторные шрифты

История компьютеров началась в мире растровых изображений. Символы были представлены растровыми изображениями, также называемыми «растровыми картами». См. следующий растровый шрифт Atari:

https://fontmeme.com/fonts/atari-font/

Технический прогресс в плане вычислительной мощности и хранения данных позволил более красиво представлять символы с помощью так называемых векторных шрифтов, которые, например, описывают букву «d» примерно как круг, пересеченный прямой линией.

Векторные шрифты можно масштабировать до размеров вселенной без потери качества. Растровые шрифты, независимо от того, сколько ресурсов они потребляют, можно масштабировать до уровня, на котором вы увидите квадратные пиксели.

Внутреннее устройство форматов файлов Adobe PDF

Формат файла PDF позволяет смешивать различные типы объектов, например, растровые изображения с использованием различных типов сжатия, а также векторные шрифты.

Схемы сжатия потерь не подходят для текста

Такие схемы сжатия, как JPEG или JPEG2000, алгоритмы которых реализованы в формате PDF-файла, не подходят для текста, поскольку их типичный режим применения с потерями создает артефакты сжатия, которые легко видны.

Неподходящий процесс создания PDF-файлов — печать на виртуальном PDF-принтере

Вероятнее всего, ваш источник распаковывается при печати, предоставляя принтеру гигантское растровое изображение, которое повторно сжимает это растровое изображение с потерями, используя схему сжатия, которая хороша для изображения, но не подходит для текста.

Вы можете не заметить эту потерю качества на отсканированном изображении, но вы заметите ее, взглянув на текст.

Решение 1

Либо попробуйте последовать совету Дэниела Б. и увеличьте качество сканирования, распечатайте его в высоком разрешении и убедитесь, что настройки принтера не сжимают изображение слишком сильно.

Решение 2

Другой способ — использовать редактор PDF, в котором вы включаете изображение как файл JPEG с потерями, а текст как файл PNG. Таким образом, ваш редактор может сохранять оба элемента (текст и изображение) отдельно в файле PDF и не использует одно единственное растровое изображение, как принтер PDF.

Затем ваш PDF-файл будет декодирован двумя движками: DCDDecode для изображения и JBIG2Decode для текста, см. раздел «растровые изображения» в статье. https://en.wikipedia.org/wiki/PDF

Решение 3

Если это не соответствует вашим ожиданиям, вам нужно будет отсканировать текст отдельно с самым высоким доступным вам оптическим разрешением. Затем вам нужно будет выполнить OCR и позволить какой-то программе угадать исходный тип шрифта. При необходимости вам нужно будет вручную исправить тип шрифта.

Помните о процессе производства вашего сканирования: есть высококачественное растровое изображение и векторный шрифт, используемый издателем. В процессе печати текст преобразуется в высококачественное растровое изображение с использованием векторной информации. Я полагаю, что это может быть до 2540 точек на дюйм.

Ваше сравнительно слабое сканирующее оборудование может обеспечить оптическое разрешение лишь в 600 точек на дюйм, что уже отражает потерю примерно 50% как по оси x, так и по оси y.

Надеюсь, это прольет свет на вашу проблему!

Question 2

Вы можете увидеть похожее в вашем выборе просмотрщика изображений. На основе текущего режима. Одинаковые 2 режима изображения, слева - как просмотрщик, справа - как редактор, и большинство "ридеров" PDF являются редакторами.

IrfanView имеет различные настройки для PDF и/или изображений. Здесь изображение PDF отображается так, как будто оно идеально отсканировано (без потерь или с потерями, не имеет значения). Видно в просмотрщике PDF, и тот же PDF, открытый в IrfanView, будет деградирован до более крупных пикселей (сначала он будет сглажен, а затем для просмотра PDF будет использоваться псевдоним).

Если рассматривать его как изображение, оно будет сглаженным.

PDF должен определять каждую форму пикселя в той или иной форме в сетке. Это может быть перекошенная сетка, и есть странные примеры. Но учтите, что большинство 99%+ будут правильными прямоугольниками. Вот 3 пикселя в ширину и 3 пикселя в высоту в отображении PDF (изображение) Google.

https://docs.google.com/gview?url=https://github.com/GitHubRulesOK/MyNotes/raw/master/colours.pdf

Вы должны видеть увеличенное или уменьшенное изображение одинаково. Так как PDF должен иметь возможность отображать QR-коды и другие пиксельные объекты без какого-либо улучшенного сглаживания. У просмотрщиков изображений другая парадигма, поскольку им нужно интерполировать и смягчать изображения. То, что вы не можете увидеть, если только это не изображение, это то, что есть 2 ЧЕРНЫХ УГЛОВЫХ пикселя и только один белый квадрат между ними.

Акробат невсегдаподдерживать чистоту цвета, чтобы эти цвета могли меняться, но не форма (если не указано иное). Мы видим изображение из того же PDF, в котором цветовой профиль RGB имеет два черных угла!

Одним из преимуществ является то, что отдельные пиксели можно вращать и непропорционально растягивать (ЭТО ТАКИЕ ЖЕ квадратные отдельные пиксели, как и выше). Диаграммы не имеют разрешения, это просто векторы. Сохранить как изображение 3x3 Я разместил их так, как будто на белом фоне 5x5. Таким образом, мы видим, что 2 квадрата черные. Тогда файл будет сохранен неправильно как 96 DPI, так как в pdf он имел другое, гораздо более низкое 3 PPI.

Просмотрщики изображений будут УСРЕДНЯТЬ пиксель с помощью правил просмотра вперед, поэтому градиент будет смягчать резкие края. Обратите внимание, что нижний левый угол отображается правильно, как более черный.

Более заметно в разных предложениях ТОЧНО ОДНО И ТО ЖЕ Изображение в ОДНОМ И ТОМ ЖЕ Просмотрщике,
как изображение слева, так и PDF-файл справа.

Answer

Вы можете увидеть похожее в вашем выборе просмотрщика изображений. На основе текущего режима. Одинаковые 2 режима изображения, слева - как просмотрщик, справа - как редактор, и большинство "ридеров" PDF являются редакторами.

IrfanView имеет различные настройки для PDF и/или изображений. Здесь изображение PDF отображается так, как будто оно идеально отсканировано (без потерь или с потерями, не имеет значения). Видно в просмотрщике PDF, и тот же PDF, открытый в IrfanView, будет деградирован до более крупных пикселей (сначала он будет сглажен, а затем для просмотра PDF будет использоваться псевдоним).

Если рассматривать его как изображение, оно будет сглаженным.

PDF должен определять каждую форму пикселя в той или иной форме в сетке. Это может быть перекошенная сетка, и есть странные примеры. Но учтите, что большинство 99%+ будут правильными прямоугольниками. Вот 3 пикселя в ширину и 3 пикселя в высоту в отображении PDF (изображение) Google.

https://docs.google.com/gview?url=https://github.com/GitHubRulesOK/MyNotes/raw/master/colours.pdf

Вы должны видеть увеличенное или уменьшенное изображение одинаково. Так как PDF должен иметь возможность отображать QR-коды и другие пиксельные объекты без какого-либо улучшенного сглаживания. У просмотрщиков изображений другая парадигма, поскольку им нужно интерполировать и смягчать изображения. То, что вы не можете увидеть, если только это не изображение, это то, что есть 2 ЧЕРНЫХ УГЛОВЫХ пикселя и только один белый квадрат между ними.

Акробат невсегдаподдерживать чистоту цвета, чтобы эти цвета могли меняться, но не форма (если не указано иное). Мы видим изображение из того же PDF, в котором цветовой профиль RGB имеет два черных угла!

Одним из преимуществ является то, что отдельные пиксели можно вращать и непропорционально растягивать (ЭТО ТАКИЕ ЖЕ квадратные отдельные пиксели, как и выше). Диаграммы не имеют разрешения, это просто векторы. Сохранить как изображение 3x3 Я разместил их так, как будто на белом фоне 5x5. Таким образом, мы видим, что 2 квадрата черные. Тогда файл будет сохранен неправильно как 96 DPI, так как в pdf он имел другое, гораздо более низкое 3 PPI.

Просмотрщики изображений будут УСРЕДНЯТЬ пиксель с помощью правил просмотра вперед, поэтому градиент будет смягчать резкие края. Обратите внимание, что нижний левый угол отображается правильно, как более черный.

Более заметно в разных предложениях ТОЧНО ОДНО И ТО ЖЕ Изображение в ОДНОМ И ТОМ ЖЕ Просмотрщике,
как изображение слева, так и PDF-файл справа.

Почему при печати изображений в формате PDF я вижу пикселизированный текст?

решение1

решение2

Связанный контент