Что означает %öäüß во второй строке PDF-файлов?

Что означает %öäüß во второй строке PDF-файлов?

Если я просматриваю PDF-файл в шестнадцатеричном редакторе, то вижу эти две первые строки:

%PDF-1.6  
%öäüß

Первая строка, как объяснено вспецификация, — номер версии PDF-файла.

Каково значение второй строки? Я не смог найти ее в спецификации.

решение1

В файлах PDF %начинается комментарий, так что это просто бесполезная строка. Многие генераторы PDF используют ее дляпредотвратить порчу файлаглючными программами

Но как? Некоторые приложения проверяют, является ли файл текстовым или двоичным, эвристически, проверяя первые блоки данных (обычно 512, 1024 или 2048 байт) и измеряя процент непечатаемых или недопустимых символов. Некоторые другие не8-битный чистый. Поэтому рекомендуется поместить не менее 4 байтов со значениями выше 127 в первые 512 байтов, чтобы заставить эти приложения распознать файл как двоичный. В противном случае могут произойти плохие вещи, такие как преобразование между CRLF и LF, усечение верхних битов или удаление недопустимых последовательностей байтов UTF-8 (если файл был распознан как текст UTF-8)

Далее следуют некоторые символы ASCII, в которых используются непечатаемые символы (обратите внимание на точки «.»), которые обычно указывают некоторым программным продуктам, что файл содержит двоичные данные и его не следует обрабатывать как 7-битный текст ASCII.

https://resources.infosecinstitute.com/pdf-file-format-basic-structure/#gref

На самом деле это рекомендуется стандартом PDF.

Примечание: Если файл PDF содержит двоичные данные, как это делают большинство (см. Раздел 3.1, «Лексические соглашения»), рекомендуется, чтобы за строкой заголовка сразу следовала строка комментария, содержащая не менее четырех двоичных символов, то есть символов с кодами 128 или выше. Это обеспечивает правильное поведение приложений передачи файлов, которые проверяют данные вблизи начала файла, чтобы определить, следует ли обрабатывать содержимое файла как текст или как двоичное.

https://www.adobe.com/content/dam/acom/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf

Если файл PDF содержит двоичные данные, как это делают большинство файлов (см. 7.2, Лексические соглашения»), за строкой заголовка должна сразу следовать строка комментария, содержащая не менее четырех двоичных символов, то есть символов с кодами 128 или выше. Это обеспечивает правильное поведение приложений передачи файлов, которые проверяют данные в начале файла, чтобы определить, следует ли обрабатывать содержимое файла как текст или как двоичное.

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf

Некоторые источники о PDF, которые я читал, говорят, что некоторые программы все еще не уверены, что файл является двоичным без нулевых байтов, но, к сожалению, вы не можете вставлять нули в комментарии PDF. Я не могу найти их прямо сейчас, поэтому процитирую позже

Связанный контент