Как использовать функцию поиска (Ctrl+F) в этом конкретном PDF-файле?

Question

Все эти «символы» находятся в «частной области использования» Unicode. В сочетании со шрифтом, содержащим глифы для этих кодовых точек, он выглядит как обычный текст.

Однако запутывание очень слабое. Давайте посмотрим на , который предположительно As. Кодовые точки — \uF041и \uF073. По совпадению, «латинская заглавная буква A» имеет \u0041, а «латинская строчная буква S» — \u0073.

Вам просто нужно пройти по всем кодовым точкам и вычесть/добавить 0xF000для преобразования из/в запутанный текст. Это позволит вам копировать текст из документа или искать текст в документе.

Вот код JavaScript, который расшифрует текст:

{
  let source = "                     ";

  let decoded = source.replace(/./g, c => {
    let cc = c.codePointAt(0);
    return cc > 0xF000 ? String.fromCodePoint(cc - 0xF000) : c;
  });

  console.log(decoded);
}

Если пойти другим путем, только для отдельных слов:

{
  let source = "understand";

  let coded = source.replace(/./g, c => String.fromCodePoint(c.codePointAt(0) + 0xF000));

  console.log(coded);
}

Оба фрагмента основаны строго на приведенном примере. Если присутствуют другие махинации с кодировкой, код требует дальнейшей корректировки.

Вы можете использовать эти фрагменты в консоли разработчика вашего браузера, обычно доступной через F12.

Answer 1