PDF-файлы старых библиотечных книг... Почему текст и фон выглядят как отдельные слои?

PDF-файлы старых библиотечных книг... Почему текст и фон выглядят как отдельные слои?

Часто, когда я открываю PDF-файл, я вижу, как появляется фон страницы,допоявляются текстовые элементы или фотографии.

Это меня озадачивает, потому что многие из этих PDF-файлов получены из сканов Google старых библиотечных книг... а не многослойных PSD, которые, как кажется, ведут себя именно так. Элементы текста и фотографий буквально удаляются из скана — фон распределяется по пустому пространству — а затем текст и фотографии векторизуются и накладываются обратно на фон? Что на самом деле происходит?

решение1

Это может быть связано с тем, что программное обеспечение OCR используется для автоматического преобразования изображения в текст. Это происходит, когда я сканирую страницы учебника с помощью сканера Xerox с возможностью OCR. Часто текст из полученного файла PDF может быть неточным или иметь лишние пробелы или находиться на разных слоях!

Связанный контент