Определить все слова, принадлежащие другому языку

Определить все слова, принадлежащие другому языку

У меня есть длинный технический текст на испанском языке. В тексте много слов на английском, потому что термины обычно не переводятся. Я хочу сделать их все курсивом, как того требует испанская грамматика.

Поэтому первым шагом является их обнаружение. Есть ли способ найти все слова в тексте, которые являются частью английского словаря? Более того, некоторые слова будут общими для обоих языков и часто будут встречаться в тексте (например, "a"), поэтому методу потребуется способ игнорировать вхождения определенных слов.

К сожалению, не все из них отмечены как ошибки в испанском языке, либо потому, что слово принято в испанском языке, либо потому, что я добавил его в местный словарь, чтобы оно не считалось орфографической ошибкой, поэтому я не могу найти их все с помощью «Проверки орфографии».

решение1

Да, это то, что вы можете сделать. Многое зависит от структуры и метаданных вашего документа, поэтому вы можете получить как феноменальные, так и посредственные результаты.

Кроме того, я нечасто пользуюсь этой функцией, поэтому могу не знать о способах повышения производительности.

  1. Откройте окно расширенного поиска (оно находится справа на ленте на вкладке «Главная»)

  2. Нажмите кнопку форматирования (в левом нижнем углу)

  3. Нажмите язык

    • Выберите язык по вашему выбору
    • нажмите ок

  4. В окне расширенного поиска установите флажок «использовать подстановочный знак».

    • И используйте одну звездочку в качестве поискового запроса (shift 8 = *)
    • Попробуйте — вы можете добиться немедленного успеха, но не сдавайтесь, если это не сработало.

  5. щелкните на вкладке «Обзор» на ленте

    • нажмите языковые настройки
    • подтвердите установку нужного вам языка.
    • Нажмите ОК.

  6. Нажмите на язык на ленте еще раз.

    • Нажмите «Установить язык проверки».
    • Выберите противоположное значение, если активно
    • Убедитесь, что функция «автоматическое определение языка» включена.
    • Нажмите ОК.

  7. Вернуться в окно расширенного поиска

    • убедитесь, что ваши параметры вернулись
    • попробуйте найти еще раз

«Более того, некоторые слова будут общими для обоих языков и часто встречаться в тексте (например, «а»), поэтому метод должен будет иметь возможность игнорировать появление определенных слов».

Это будет проблемой. Особенно с языками, которые имеют долгую перемешанную историю. Есть несколько стратегий, которые вы можете использовать, чтобы справиться с этим, и одна из них разрушительна, поэтомуубедитесь, что вы работаете с копией, а не с оригиналом!

  • Возможно, вам повезет, если вы переведете со спанглиша на третий, более далекий язык. Это должно сломать некоторые сходства, но этого может быть недостаточно, чтобы вы действительно начали.

  • удалите все слова из языка, которые вы не хотите найти. Если вы ищете английский, удалите все испанские работы. Это очистит ваш документ и поможет вам найти закономерности, которые вы могли бы пропустить.

  • прочитайте эту статью о сопоставлении шаблонов с помощью подстановочных знаков https://www.google.com/amp/s/www.pcworld.com/article/3060753/word-pro-tips-use-wildcards-for-faster-more-accurate-search-and-replace-results.amp.html

Удачи!

Связанный контент