PDFからテキストをコピーしようとしていますが、ゴミが出てしまいます

Question

基になるテキストが文字化けしています。@skub が、わざとそうしているのではないかと考えているのは正しいと思います。テキストを取得する 1 つの方法は、各ページを画像としてエクスポートすることです (例:.jpgまたは.png）で画像をスキャンしますOCCRソフトウェアです。Windows 7 で Adobe Acrobat X を使用してテストしたところ、動作しました。

アップデート：

ドキュメントビューアに同様の機能がある場合は、copy with formatting期待どおりにテキストをコピーします。さらに詳しく調べると、埋め込まれたフォントが全て持っているカスタムエンコーディング。

Answer 1

基になるテキストが文字化けしています。@skub が、わざとそうしているのではないかと考えているのは正しいと思います。テキストを取得する 1 つの方法は、各ページを画像としてエクスポートすることです (例:.jpgまたは.png）で画像をスキャンしますOCCRソフトウェアです。Windows 7 で Adobe Acrobat X を使用してテストしたところ、動作しました。

アップデート：

ドキュメントビューアに同様の機能がある場合は、copy with formatting期待どおりにテキストをコピーします。さらに詳しく調べると、埋め込まれたフォントが全て持っているカスタムエンコーディング。

PDFからテキストをコピーしようとしていますが、ゴミが出てしまいます

答え1

アップデート：

関連情報