異なる言語に属するすべての単語を検出する

異なる言語に属するすべての単語を検出する

スペイン語で書かれた長い技術文書があります。 用語は通常翻訳されないため、文書内には英語の単語が多数あります。 スペイン語の文法で義務付けられているため、すべてを筆記体にしたいと考えています。

したがって、最初のステップは、それらの単語を見つけることです。テキスト内の英語辞書に含まれるすべての単語を見つける方法はありますか? さらに、一部の単語は両方の言語に共通で、テキストに頻繁に出現します (たとえば、「a」)。そのため、この方法では、特定の単語の出現を無視する方法が必要になります。

残念ながら、その単語がスペイン語で受け入れられているか、スペルミスとしてカウントされないようにローカル辞書に追加したため、すべてがスペイン語でエラーとしてマークされているわけではありません。そのため、「スペルチェック」ですべてを見つけることはできません。

答え1

はい、これは可能です。ただし、ドキュメントの構造とメタデータに大きく依存するため、素晴らしい結果になる場合もあれば、平凡な結果になる場合もあります。

また、この機能を頻繁に使用していないため、パフォーマンスを向上させる方法を認識していない可能性があります。

  1. 高度な検索ウィンドウを開きます(ホームタブのリボンの右側にあります)

  2. フォーマットボタン(左下隅)をクリックします。

  3. 言語をクリック

    • ご希望の言語を選択してください
    • OKをクリック

  4. 詳細検索ウィンドウで、「ワイルドカードを使用する」チェックボックスをオンにします。

    • 検索語としてアスタリスク 1 つを使用します (Shift + 8 = *)
    • 試してみましょう - すぐに成功するかもしれませんが、うまくいかなくても諦めないでください

  5. リボンのレビュータブで言語をクリックします

    • 言語設定をクリック
    • 希望する言語がインストールされていることを確認します。
    • [OK]をクリックします

  6. リボンの言語をもう一度クリックします

    • 校正言語の設定をクリック
    • アクティブな場合はその反対のものを選択してください
    • 「言語を自動的に検出する」が有効になっていることを確認します
    • [OK]をクリックします

  7. 詳細検索ウィンドウに戻る

    • オプションが元に戻っていることを確認してください
    • もう一度検索してみてください

「さらに、一部の単語は両方の言語に共通しており、テキストに頻繁に出現します(たとえば、「a」)。そのため、この方法では特定の単語の出現を無視する方法が必要になります。」

これは問題になります。特に、長い歴史が混ざり合った言語では。これを解決するために採用できる戦略がいくつかあります。そのうちの1つは破壊的なものです。必ずオリジナルではなくコピーから作業してください。

  • スパニッシュから第三の、より遠い言語に翻訳できれば、うまくいくかもしれません。それによって共通点がいくつかなくなるはずですが、実際に作業を進めるには十分ではないかもしれません。

  • 検索したくない言語の単語をすべて削除します。英語を探している場合は、スペイン語の単語をすべて削除します。これにより、ドキュメントが整理され、見逃していた可能性のあるパターンを見つけやすくなります。

  • ワイルドカードを使ったパターンマッチングに関するこの記事を読む https://www.google.com/amp/s/www.pcworld.com/article/3060753/word-pro-tips-use-wildcards-for-faster-more-accurate-search-and-replace-results.amp.html

幸運を!

関連情報