画像を PDF に印刷すると、ピクセル化されたテキストが表示されるのはなぜですか?

画像を PDF に印刷すると、ピクセル化されたテキストが表示されるのはなぜですか?

スキャンした画像 (JPG や PNG など) を PDF に印刷するたびに、テキストがピクセル化されますが、ソース画像はピクセル化されません。どの PDF ライターを使用しても、同じ結果になります。Adobe は持っていませんが、他の 5 ~ 6 種類を試しましたが、結果は同じでした。

さまざまなオンライン ツールを使用してこれらの PDF を画像に戻すことができ、その画像ではフル解像度が維持されます。これは PDF ビューア固有の問題でもありません。

その理由は何でしょうか? PDF でロスレス画像を表示することはできないのでしょうか?

印刷時の品質設定や DPI 設定があることは知っていますが、これらはテキストのピクセル化には影響しません。

ここに画像の説明を入力してください

答え1

PDF ファイルの品質が低い理由は、ベクター イメージとビットマップ イメージの違いと PDF ファイル形式の内部構造を理解していないためです。このため、意図した結果が得られない不適切な制作プロセスが発生します。

ビットマップフォントとベクターフォント

コンピュータの歴史はビットマップの世界から始まりました。文字はビットマップ (ラスター マップとも呼ばれます) で表現されました。次の Atari ビットマップ フォントを参照してください。

https://fontmeme.com/fonts/atari-font/

計算能力とストレージに関する技術的進歩により、いわゆるベクター フォントを使用して文字をより美しく表現できるようになりました。ベクター フォントでは、たとえば文字「d」を直線が接する円として大まかに表現できます。

ベクター フォントは、品質を損なうことなく、宇宙の大きさまで拡大できます。ビットマップ フォントは、消費するリソースの量に関係なく、正方形のピクセルが見えるレベルまで拡大できます。

Adobe PDF ファイル形式の内部

PDF ファイル形式では、異なるタイプのオブジェクトを混在させることができます。たとえば、異なるタイプの圧縮を使用したビットマップ イメージだけでなく、ベクター フォントも混在させることができます。

テキストには適さない損失圧縮方式

PDF ファイル形式内にアルゴリズムが実装されている JPEG や JPEG2000 などの圧縮方式は、典型的な非可逆アプリケーション モードによって簡単に目に見える圧縮アーティファクトが作成されることから、テキストには適していません。

不適切な PDF 作成プロセス - 仮想 PDF プリンターへの印刷

おそらく、ソースは印刷時に解凍され、巨大なビットマップがプリンターに提供され、プリンターは、画像には適しているがテキストには適さない圧縮方式を使用して、このビットマップを非可逆方式で再圧縮します。

スキャンした画像ではこの品質の低下は見られないかもしれませんが、テキストを見るとわかります。

解決策1

Daniel B. のヒントに従って、スキャン品質を上げて高解像度で印刷し、プリンター設定で画像が過度に圧縮されないようにしてみてください。

解決策2

もう 1 つの方法は、PDF エディターを使用して、画像を非可逆 JPEG として、テキストを PNG ファイルとして含めることです。この方法では、エディターは PDF ファイル内で両方の要素 (テキストと画像) を個別に保存でき、PDF プリンターのように 1 つのビットマップを使用することはありません。

PDFファイルは2つのエンジンでデコードされます。画像用のDCDDecodeとテキスト用のJBIG2Decodeです。記事の「ラスター画像」のセクションを参照してください。 https://en.wikipedia.org/wiki/PDF

解決策3

これが期待に沿わない場合は、利用可能な最高の光学解像度でテキストを個別にスキャンする必要があります。次に、OCR を実行し、何らかのプログラムに元のフォント タイプを推測させる必要があります。必要に応じて、フォント タイプを手動で修正する必要があります。

スキャンの制作プロセスに留意してください。高品質のビットマップ イメージと、出版社が使用するベクター フォントがあります。印刷プロセス中に、テキストはベクター情報を使用して高品質のビットマップに変換されます。おそらく 2540 dpi になると思います。

比較的性能の悪いスキャン機器では、光学的に 600 dpi の数値しか提供できない可能性がありますが、これはすでに x 軸と y 軸の両方で約 50% の損失を反映しています。

あなたの問題が少しでも解明されることを願っています!

答え2

画像ビューアの選択でも同様の結果が表示されます。現在のモードに基づきます。同じ画像の 2 つのモード。左はビューア、右はエディターです。ほとんどの PDF「リーダー」はエディターです。

ここに画像の説明を入力してください

IrfanView には、PDF や画像用のさまざまな設定があります。ここでは、PDF 画像は完全にスキャンされたかのように表示されます (ロスレスかロスレスかは関係ありません)。PDF ビューアで表示され、同じ PDF を IrfanView で開くと、ピクセルが大きくなります (最初にアンチエイリアス処理されますが、その後 PDF の表示にはエイリアスが使用されます)。 ここに画像の説明を入力してください

画像として見ると滑らかになります。

ここに画像の説明を入力してください
PDF では、グリッド内の各ピクセルの形状を何らかの形で定義する必要があります。歪んだグリッドになる場合もあり、奇妙な例もあります。しかし、大部分の 99% 以上は規則的な長方形になると考えてください。Google の PDF (画像) 表示では、幅 3 ピクセル、高さ 3 ピクセルです。

ズームインまたはズームアウトしても、まったく同じに見えるはずです。PDF は、QR コードやその他のピクセル ベースのオブジェクトを、強化されたスムージングなしで表示できる必要があります。画像ビューアは、画像を補間してソフト化する必要があるため、パラダイムが異なります。画像としてしか見えないのは、2 つの黒い角のピクセルと、その間にある 1 つの白い四角形ピクセルだけです。

ここに画像の説明を入力してください

アクロバットはいつも色の純度を維持するため、色はシフトできますが、形状はシフトできません (指示されない限り)。同じ PDF からの画像を見ると、RGB カラー プロファイルに 2 つの黒い角があることがわかります。 ここに画像の説明を入力してください

1 つの利点は、単一のピクセルを回転したり、不均衡に引き伸ばしたりできることです (これらは上記の正方形の単一のピクセルと同じです)。チャートには解像度がなく、単にベクターです。保存イメージは 3x3 で、5x5 の白い背景に配置したかのようにしています。したがって、2 つの正方形が黒であることがわかります。その後、ファイルは 96 DPI として誤って保存されます。これは、pdf でははるかに低い 3 PPI であったためです。

ここに画像の説明を入力してください

画像ビューアは先読みルールを使用してピクセルを平均化するため、グラデーションによって角が丸くなります。左下隅は正しく黒く表示されます。

ここに画像の説明を入力してください

異なる製品ではさらに顕著になりますが、まったく同じ画像が同じビューアで表示され、
左側が画像、右側が PDF です。

ここに画像の説明を入力してください

関連情報