画像を PDF に印刷すると、ピクセル化されたテキストが表示されるのはなぜですか?

Question 1

PDF ファイルの品質が低い理由は、ベクターイメージとビットマップイメージの違いと PDF ファイル形式の内部構造を理解していないためです。このため、意図した結果が得られない不適切な制作プロセスが発生します。

ビットマップフォントとベクターフォント

コンピュータの歴史はビットマップの世界から始まりました。文字はビットマップ (ラスターマップとも呼ばれます) で表現されました。次の Atari ビットマップフォントを参照してください。

https://fontmeme.com/fonts/atari-font/

計算能力とストレージに関する技術的進歩により、いわゆるベクターフォントを使用して文字をより美しく表現できるようになりました。ベクターフォントでは、たとえば文字「d」を直線が接する円として大まかに表現できます。

ベクターフォントは、品質を損なうことなく、宇宙の大きさまで拡大できます。ビットマップフォントは、消費するリソースの量に関係なく、正方形のピクセルが見えるレベルまで拡大できます。

Adobe PDF ファイル形式の内部

PDF ファイル形式では、異なるタイプのオブジェクトを混在させることができます。たとえば、異なるタイプの圧縮を使用したビットマップイメージだけでなく、ベクターフォントも混在させることができます。

テキストには適さない損失圧縮方式

PDF ファイル形式内にアルゴリズムが実装されている JPEG や JPEG2000 などの圧縮方式は、典型的な非可逆アプリケーションモードによって簡単に目に見える圧縮アーティファクトが作成されることから、テキストには適していません。

不適切な PDF 作成プロセス - 仮想 PDF プリンターへの印刷

おそらく、ソースは印刷時に解凍され、巨大なビットマップがプリンターに提供され、プリンターは、画像には適しているがテキストには適さない圧縮方式を使用して、このビットマップを非可逆方式で再圧縮します。

スキャンした画像ではこの品質の低下は見られないかもしれませんが、テキストを見るとわかります。

解決策1

Daniel B. のヒントに従って、スキャン品質を上げて高解像度で印刷し、プリンター設定で画像が過度に圧縮されないようにしてみてください。

解決策2

もう 1 つの方法は、PDF エディターを使用して、画像を非可逆 JPEG として、テキストを PNG ファイルとして含めることです。この方法では、エディターは PDF ファイル内で両方の要素 (テキストと画像) を個別に保存でき、PDF プリンターのように 1 つのビットマップを使用することはありません。

PDFファイルは2つのエンジンでデコードされます。画像用のDCDDecodeとテキスト用のJBIG2Decodeです。記事の「ラスター画像」のセクションを参照してください。 https://en.wikipedia.org/wiki/PDF

解決策3

これが期待に沿わない場合は、利用可能な最高の光学解像度でテキストを個別にスキャンする必要があります。次に、OCR を実行し、何らかのプログラムに元のフォントタイプを推測させる必要があります。必要に応じて、フォントタイプを手動で修正する必要があります。

スキャンの制作プロセスに留意してください。高品質のビットマップイメージと、出版社が使用するベクターフォントがあります。印刷プロセス中に、テキストはベクター情報を使用して高品質のビットマップに変換されます。おそらく 2540 dpi になると思います。

比較的性能の悪いスキャン機器では、光学的に 600 dpi の数値しか提供できない可能性がありますが、これはすでに x 軸と y 軸の両方で約 50% の損失を反映しています。

あなたの問題が少しでも解明されることを願っています!

Answer

PDF ファイルの品質が低い理由は、ベクターイメージとビットマップイメージの違いと PDF ファイル形式の内部構造を理解していないためです。このため、意図した結果が得られない不適切な制作プロセスが発生します。

ビットマップフォントとベクターフォント

コンピュータの歴史はビットマップの世界から始まりました。文字はビットマップ (ラスターマップとも呼ばれます) で表現されました。次の Atari ビットマップフォントを参照してください。

https://fontmeme.com/fonts/atari-font/

計算能力とストレージに関する技術的進歩により、いわゆるベクターフォントを使用して文字をより美しく表現できるようになりました。ベクターフォントでは、たとえば文字「d」を直線が接する円として大まかに表現できます。

ベクターフォントは、品質を損なうことなく、宇宙の大きさまで拡大できます。ビットマップフォントは、消費するリソースの量に関係なく、正方形のピクセルが見えるレベルまで拡大できます。

Adobe PDF ファイル形式の内部

PDF ファイル形式では、異なるタイプのオブジェクトを混在させることができます。たとえば、異なるタイプの圧縮を使用したビットマップイメージだけでなく、ベクターフォントも混在させることができます。

テキストには適さない損失圧縮方式

PDF ファイル形式内にアルゴリズムが実装されている JPEG や JPEG2000 などの圧縮方式は、典型的な非可逆アプリケーションモードによって簡単に目に見える圧縮アーティファクトが作成されることから、テキストには適していません。

不適切な PDF 作成プロセス - 仮想 PDF プリンターへの印刷

おそらく、ソースは印刷時に解凍され、巨大なビットマップがプリンターに提供され、プリンターは、画像には適しているがテキストには適さない圧縮方式を使用して、このビットマップを非可逆方式で再圧縮します。

スキャンした画像ではこの品質の低下は見られないかもしれませんが、テキストを見るとわかります。

解決策1

Daniel B. のヒントに従って、スキャン品質を上げて高解像度で印刷し、プリンター設定で画像が過度に圧縮されないようにしてみてください。

解決策2

もう 1 つの方法は、PDF エディターを使用して、画像を非可逆 JPEG として、テキストを PNG ファイルとして含めることです。この方法では、エディターは PDF ファイル内で両方の要素 (テキストと画像) を個別に保存でき、PDF プリンターのように 1 つのビットマップを使用することはありません。

PDFファイルは2つのエンジンでデコードされます。画像用のDCDDecodeとテキスト用のJBIG2Decodeです。記事の「ラスター画像」のセクションを参照してください。 https://en.wikipedia.org/wiki/PDF

解決策3

これが期待に沿わない場合は、利用可能な最高の光学解像度でテキストを個別にスキャンする必要があります。次に、OCR を実行し、何らかのプログラムに元のフォントタイプを推測させる必要があります。必要に応じて、フォントタイプを手動で修正する必要があります。

スキャンの制作プロセスに留意してください。高品質のビットマップイメージと、出版社が使用するベクターフォントがあります。印刷プロセス中に、テキストはベクター情報を使用して高品質のビットマップに変換されます。おそらく 2540 dpi になると思います。

比較的性能の悪いスキャン機器では、光学的に 600 dpi の数値しか提供できない可能性がありますが、これはすでに x 軸と y 軸の両方で約 50% の損失を反映しています。

あなたの問題が少しでも解明されることを願っています!

Question 2

画像ビューアの選択でも同様の結果が表示されます。現在のモードに基づきます。同じ画像の 2 つのモード。左はビューア、右はエディターです。ほとんどの PDF「リーダー」はエディターです。

IrfanView には、PDF や画像用のさまざまな設定があります。ここでは、PDF 画像は完全にスキャンされたかのように表示されます (ロスレスかロスレスかは関係ありません)。PDF ビューアで表示され、同じ PDF を IrfanView で開くと、ピクセルが大きくなります (最初にアンチエイリアス処理されますが、その後 PDF の表示にはエイリアスが使用されます)。

画像として見ると滑らかになります。

PDF では、グリッド内の各ピクセルの形状を何らかの形で定義する必要があります。歪んだグリッドになる場合もあり、奇妙な例もあります。しかし、大部分の 99% 以上は規則的な長方形になると考えてください。Google の PDF (画像) 表示では、幅 3 ピクセル、高さ 3 ピクセルです。

https://docs.google.com/gview?url=https://github.com/GitHubRulesOK/MyNotes/raw/master/colours.pdf

ズームインまたはズームアウトしても、まったく同じに見えるはずです。PDF は、QR コードやその他のピクセルベースのオブジェクトを、強化されたスムージングなしで表示できる必要があります。画像ビューアは、画像を補間してソフト化する必要があるため、パラダイムが異なります。画像としてしか見えないのは、2 つの黒い角のピクセルと、その間にある 1 つの白い四角形ピクセルだけです。

アクロバットはいつも色の純度を維持するため、色はシフトできますが、形状はシフトできません (指示されない限り)。同じ PDF からの画像を見ると、RGB カラープロファイルに 2 つの黒い角があることがわかります。

1 つの利点は、単一のピクセルを回転したり、不均衡に引き伸ばしたりできることです (これらは上記の正方形の単一のピクセルと同じです)。チャートには解像度がなく、単にベクターです。保存イメージは 3x3 で、5x5 の白い背景に配置したかのようにしています。したがって、2 つの正方形が黒であることがわかります。その後、ファイルは 96 DPI として誤って保存されます。これは、pdf でははるかに低い 3 PPI であったためです。

画像ビューアは先読みルールを使用してピクセルを平均化するため、グラデーションによって角が丸くなります。左下隅は正しく黒く表示されます。

異なる製品ではさらに顕著になりますが、まったく同じ画像が同じビューアで表示され、
左側が画像、右側が PDF です。

Answer

画像ビューアの選択でも同様の結果が表示されます。現在のモードに基づきます。同じ画像の 2 つのモード。左はビューア、右はエディターです。ほとんどの PDF「リーダー」はエディターです。

IrfanView には、PDF や画像用のさまざまな設定があります。ここでは、PDF 画像は完全にスキャンされたかのように表示されます (ロスレスかロスレスかは関係ありません)。PDF ビューアで表示され、同じ PDF を IrfanView で開くと、ピクセルが大きくなります (最初にアンチエイリアス処理されますが、その後 PDF の表示にはエイリアスが使用されます)。

画像として見ると滑らかになります。

PDF では、グリッド内の各ピクセルの形状を何らかの形で定義する必要があります。歪んだグリッドになる場合もあり、奇妙な例もあります。しかし、大部分の 99% 以上は規則的な長方形になると考えてください。Google の PDF (画像) 表示では、幅 3 ピクセル、高さ 3 ピクセルです。

https://docs.google.com/gview?url=https://github.com/GitHubRulesOK/MyNotes/raw/master/colours.pdf

ズームインまたはズームアウトしても、まったく同じに見えるはずです。PDF は、QR コードやその他のピクセルベースのオブジェクトを、強化されたスムージングなしで表示できる必要があります。画像ビューアは、画像を補間してソフト化する必要があるため、パラダイムが異なります。画像としてしか見えないのは、2 つの黒い角のピクセルと、その間にある 1 つの白い四角形ピクセルだけです。

アクロバットはいつも色の純度を維持するため、色はシフトできますが、形状はシフトできません (指示されない限り)。同じ PDF からの画像を見ると、RGB カラープロファイルに 2 つの黒い角があることがわかります。

1 つの利点は、単一のピクセルを回転したり、不均衡に引き伸ばしたりできることです (これらは上記の正方形の単一のピクセルと同じです)。チャートには解像度がなく、単にベクターです。保存イメージは 3x3 で、5x5 の白い背景に配置したかのようにしています。したがって、2 つの正方形が黒であることがわかります。その後、ファイルは 96 DPI として誤って保存されます。これは、pdf でははるかに低い 3 PPI であったためです。

画像ビューアは先読みルールを使用してピクセルを平均化するため、グラデーションによって角が丸くなります。左下隅は正しく黒く表示されます。

異なる製品ではさらに顕著になりますが、まったく同じ画像が同じビューアで表示され、
左側が画像、右側が PDF です。

画像を PDF に印刷すると、ピクセル化されたテキストが表示されるのはなぜですか?

答え1

答え2

関連情報