古い図書館の本の PDF... テキストと背景が別々のレイヤーにあるように見えるのはなぜですか?

Question

これは、OCR ソフトウェアを使用して画像を自動的にテキストに変換しているためである可能性があります。これは、OCR 機能を備えた Xerox スキャナで教科書のページをスキャンしたときに発生します。多くの場合、結果として得られる PDF ファイルのテキストは正確でなかったり、余分なスペースがあったり、完全に異なるレイヤーにあったりすることがあります。

Answer 1

これは、OCR ソフトウェアを使用して画像を自動的にテキストに変換しているためである可能性があります。これは、OCR 機能を備えた Xerox スキャナで教科書のページをスキャンしたときに発生します。多くの場合、結果として得られる PDF ファイルのテキストは正確でなかったり、余分なスペースがあったり、完全に異なるレイヤーにあったりすることがあります。

古い図書館の本の PDF... テキストと背景が別々のレイヤーにあるように見えるのはなぜですか?

答え1

関連情報