Удаление всех вхождений цвета из PDF-файла

Удаление всех вхождений цвета из PDF-файла

Я студент, и у меня есть 4-страничный PDF-документ с образцом теста. Ответы на вопросы теста написаны на документе синей ручкой; единственные другие цвета в документе — черный (текстовые вопросы) и белый (фон PDF).

Есть ли бесплатный и простой способ удалить все экземпляры синего цвета из документа? Я думал, что что-то в Photoshop может сработать, но, к сожалению, у меня сейчас нет доступа к какой-либо программе для редактирования изображений.

решение1

Мне удалось сделать что-то подобное с помощью инструмента командной строки Imagemagick, основанного надругой ответ.

Этот пример преобразует первые четыре страницы input.pdf, изменяя два цвета RBG hex c00000и 4472c4на белый, с 1% "фактором размытия". Я использовал импорт скриншотов gimp для проверки hex цветов.

convert -density 300 +antialias 'input.pdf[0-3]' \
        -fuzz 1% -fill white -opaque '#c00000' \
        -fuzz 1% -fill white -opaque '#4472c4' \
        output.pdf

Вам, вероятно, понадобитсявключить преобразование PDFпервый.

Проблема этого решения в том, что оно преобразует каждую страницу в изображение в выходном PDF. Мне это нужно было сделать только для того, чтобы распечатать документ, так что для меня это не было проблемой.

Опция +antialiasотключает сглаживание. Без этого нечеткие границы удаленного текста все равно будут видны.

решение2

  1. Конвертируйте PDF в HTML.https://cloudconvert.com/pdf-to-html
  2. Откройте HTML-файл в веб-браузере.
  3. Откройте элемент проверки.
  4. Нажмите значок «Выберите элемент на странице, чтобы просмотреть его».
  5. Нажмите на красный текст и найдите класс CSS, отвечающий заcolor: red;
  6. Чтобы скрыть его, добавьте его display: none;в тот же класс.
  7. Распечатайте страницу и сохраните ее как PDF-файл.
  8. Вуаля! ✨

Векторный текст по-прежнему сохранится в новом PDF-файле, если только вы не отметите галочкой «Печатать как изображение».

Связанный контент