Как удалить повторяющиеся фразы из очень длинного списка фраз?

Как удалить повторяющиеся фразы из очень длинного списка фраз?

У меня новый iMac с Mountain Lion, и я использую Word 2008. Я отсортировал свой список, который составляет более ста страниц и содержит много повторяющихся фраз. Каждая фраза находится на отдельной строке, и каждая строка заканчивается жестким возвратом. Я попытался ввести ^([^\n]+)\n\1 в поле Find What: в диалоговом окне Find and Replace, надеясь, что он найдет и удалит все повторяющиеся фразы, но получил сообщение об ошибке, в котором говорилось: «^( не является допустимым специальным символом для поля Find What». Любая помощь была бы очень кстати. Похоже, то, что я пытаюсь сделать, относительно просто. Так ли это? -- Пэт

решение1

Опция 1

Я предполагаю, что, поскольку у вас есть Word, у вас также естьЭксель. Если это так, вы можете использовать Excel, чтобы добиться желаемого:

  • Скопируйте и вставьте список фраз из Word в электронную таблицу Excel.

  • Следить за этимкраткое руководствовыделить уникальные фразы с помощью фильтра.

  • Выделите и скопируйте-вставьте полученный список фраз из Excel обратно в документ Word.

Вариант 2

Если ваша информация не является «конфиденциальной», вы можете воспользоваться онлайн-инструментом, например, этим:

http://www.textfixer.com/tools/remove-duplicate-lines.php

:-) М

решение2

Я не уверен, как это сделать в Word, но это легко сделать из командной строки:

sort -u < phrases.txt > phrases-sorted-unique.txt

Или, если повторяющиеся фразы уже находятся в последовательных строках, просто:

uniq < phrases.txt > phrases-unique.txt

Связанный контент