この特定の PDF で検索機能 (Ctrl+F) を使用するにはどうすればよいですか?

Question

これらの「文字」はすべて、Unicode の「私的使用領域」にあります。これらのコードポイントのグリフを含むフォントと組み合わせると、通常のテキストとして表示されます。

ただし、難読化は非常に弱いです。を見てみましょう。これはであるはずですAs。コードポイントは\uF041とです\uF073。偶然にも、「ラテン大文字 A」はで\u0041、「ラテン小文字 S」はです\u0073。

すべてのコードポイントを調べて、0xF000難読化されたテキストから減算/加算して、難読化されたテキストに変換するだけです。これにより、ドキュメントからテキストをコピーしたり、ドキュメント内のテキストを検索したりできるようになります。

テキストをデコードする JavaScript コードを次に示します。

{
  let source = "                     ";

  let decoded = source.replace(/./g, c => {
    let cc = c.codePointAt(0);
    return cc > 0xF000 ? String.fromCodePoint(cc - 0xF000) : c;
  });

  console.log(decoded);
}

逆に、単語のみの場合は次のようになります。

{
  let source = "understand";

  let coded = source.replace(/./g, c => String.fromCodePoint(c.codePointAt(0) + 0xF000));

  console.log(coded);
}

どちらのスニペットも、示された例に厳密に基づいています。他のエンコードの不正行為が存在する場合は、コードをさらに調整する必要があります。

これらのスニペットは、通常はからアクセスできるブラウザの開発者コンソールで使用できますF12。

Answer 1