PDF ファイルの 2 行目にある %öäüß はどういう意味ですか?

PDF ファイルの 2 行目にある %öäüß はどういう意味ですか?

16 進エディターで PDF ファイルを表示すると、最初の 2 行が表示されます。

%PDF-1.6  
%öäüß

最初の行は、スペックは PDF のバージョン番号です。

2 行目の意味は何ですか? 仕様では見つけられませんでした。

答え1

PDFファイルでは%コメントが始まるので、これは単なる無意味な文字列です。多くのPDFジェネレーターはこれを使用して、ファイルが壊れないようにするバグのあるプログラムによって

しかし、どうやって?一部のアプリケーションは、データの最初のブロック(通常は512、1024、または2048バイト)をチェックして、ファイルがテキストかバイナリかを判断し、印刷できない文字や無効な文字の割合を測定します。他のアプリケーションは、8ビットクリーンしたがって、最初の 512 バイトに 127 を超える値を少なくとも 4 バイト入れて、これらのアプリにファイルをバイナリとして認識させることをお勧めします。そうしないと、CRLF と LF の変換、上位ビットの切り捨て、無効な UTF-8 バイト シーケンスの削除 (ファイルが UTF-8 テキストとして認識された場合) などの問題が発生します。

以下は、印刷できない文字を使用している ASCII 文字の一部です (「.」ドットに注意)。これは通常、ファイルにバイナリ データが含まれており、7 ビット ASCII テキストとして処理すべきではないことを一部のソフトウェア製品に伝えるために使用されます。

https://resources.infosecinstitute.com/pdf-file-format-basic-structure/#gref

これはPDF標準で推奨されている。

注記: PDF ファイルにバイナリ データが含まれている場合 (ほとんどのファイルでそうであるように (セクション 3.1「語彙規則」を参照))、ヘッダー行の直後に少なくとも 4 つのバイナリ文字 (つまり、コードが 128 以上の文字) を含むコメント行を続けることをお勧めします。これにより、ファイルの先頭近くのデータを検査して、ファイルの内容をテキストとして扱うかバイナリとして扱うかを判断するファイル転送アプリケーションが適切に動作するようになります。

https://www.adobe.com/content/dam/acom/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf

PDF ファイルにバイナリ データが含まれている場合 (ほとんどの場合そうであるように (7.2 語彙規則を参照))、ヘッダー行の直後に少なくとも 4 つのバイナリ文字 (つまり、コードが 128 以上の文字) を含むコメント行が続く必要があります。これにより、ファイルの先頭近くのデータを検査して、ファイルの内容をテキストとして扱うかバイナリとして扱うかを決定するファイル転送アプリケーションの適切な動作が保証されます。

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf

私が読んだPDFに関するいくつかの情報源によると、一部のプログラムはファイルがゼロバイトのないバイナリであるとまだ確信していないようですが、残念ながらPDFコメントにゼロを埋め込むことはできません。今は見つけられないので、後で引用します。

関連情報