非常に長いフレーズリストから重複したフレーズを削除するにはどうすればよいですか?

非常に長いフレーズリストから重複したフレーズを削除するにはどうすればよいですか?

私は Mountain Lion が動作する比較的新しい iMac を持っていて、Word 2008 を使用しています。100 ページ以上あるリストを並べ替えましたが、重複するフレーズが多数あります。各フレーズは別の行にあり、各行はハード リターンで終わります。重複するフレーズをすべて見つけて削除してくれることを期待して、[検索と置換] ダイアログ ボックスの [検索する文字列] フィールドに ^([^\n]+)\n\1 と入力してみましたが、「^( は [検索する文字列] ボックスで有効な特殊文字ではありません」というエラー メッセージが表示されました。どなたか助けていただけると大変助かります。私がしようとしていることは比較的簡単なように思えます。本当にそうでしょうか? -- Pat

答え1

オプション1

Wordをお持ちなので、エクセルその場合は、Excel を使用して目的を達成できます。

  • Word からフレーズのリストをコピーして Excel スプレッドシートに貼り付けます。

  • これに従ってください短いガイドフィルターを使用して一意のフレーズを分離します。

  • Excel から取得したフレーズのリストを強調表示し、コピーして Word 文書に貼り付けます。

オプション2

情報が「機密」でない場合は、次のようなオンライン ツールを使用できます。

http://www.textfixer.com/tools/remove-duplicate-lines.php

:-) M

答え2

Word でどのように行うかはわかりませんが、コマンド ラインから行うのは簡単です。

sort -u < phrases.txt > phrases-sorted-unique.txt

または、重複するフレーズがすでに連続した行にある場合は、次のようにします。

uniq < phrases.txt > phrases-unique.txt

関連情報