Como excluo frases duplicadas de uma lista muito longa de frases?

Como excluo frases duplicadas de uma lista muito longa de frases?

Eu tenho um iMac mais recente rodando o Mountain Lion e estou usando o Word 2008. Classifiquei minha lista, que tem mais de cem páginas e muitas frases duplicadas. Cada frase está em uma linha separada e cada linha termina com um retorno rígido. Tentei inserir ^([^\n]+)\n\1 no campo Localizar: na caixa de diálogo Localizar e Substituir, esperando que ele encontrasse e excluísse todas as frases duplicadas, mas recebi uma mensagem de erro que dizia " ^( não é um caractere especial válido para a caixa Localizar." Qualquer ajuda seria muito apreciada. Parece que o que estou tentando fazer é relativamente simples. Não é? - Pat

Responder1

Opção 1

Presumo que, visto que você tem o Word, você também temExcel. Se for esse o caso, você pode usar o Excel para conseguir o que deseja:

  • Copie e cole sua lista de frases do Word em uma planilha do Excel.

  • Siga issobreve guiapara isolar as frases exclusivas usando um filtro.

  • Destaque e copie e cole a lista resultante de frases do Excel de volta ao seu documento do Word.

opção 2

Se suas informações não forem "sensíveis", você poderá usar uma ferramenta online como esta:

http://www.textfixer.com/tools/remove-duplicate-lines.php

:-)M

Responder2

Não sei como fazer isso no Word, mas é fácil na linha de comando:

sort -u < phrases.txt > phrases-sorted-unique.txt

Ou se as frases duplicadas já estiverem em linhas consecutivas, basta:

uniq < phrases.txt > phrases-unique.txt

informação relacionada