¿Cómo elimino frases duplicadas de una lista muy larga de frases?

¿Cómo elimino frases duplicadas de una lista muy larga de frases?

Tengo una iMac nueva con Mountain Lion y estoy usando Word 2008. He ordenado mi lista, que tiene más de cien páginas y muchas frases duplicadas. Cada frase está en una línea separada y cada línea termina con un retorno duro. Intenté ingresar ^([^\n]+)\n\1 en el campo Buscar: en el cuadro de diálogo Buscar y reemplazar, con la esperanza de encontrar y eliminar todas las frases duplicadas, pero recibí un mensaje de error que decía " ^( no es un carácter especial válido para el cuadro Buscar". Cualquier ayuda sería muy apreciada. Parece que lo que estoy tratando de hacer es relativamente simple. ¿Lo es? -- Pat

Respuesta1

Opción 1

Supongo que, como tienes Word, también tienesSobresalir. Si ese es el caso, puedes usar Excel para lograr lo que deseas:

  • Copie y pegue su lista de frases de Word en una hoja de cálculo de Excel.

  • Sigue estoguía cortapara aislar las frases únicas usando un filtro.

  • Resalte y copie y pegue la lista resultante de frases de Excel nuevamente en su documento de Word.

opcion 2

Si su información no es "sensible", puede utilizar una herramienta en línea como esta:

http://www.textfixer.com/tools/remove-duplicate-lines.php

:-) M

Respuesta2

No estoy seguro de cómo hacerlo en Word, pero es fácil hacerlo desde la línea de comando:

sort -u < phrases.txt > phrases-sorted-unique.txt

O si las frases duplicadas ya están en líneas consecutivas, simplemente:

uniq < phrases.txt > phrases-unique.txt

información relacionada