Mezcla de archivos de varias líneas

Question 1

POSIXly, podrías hacer algo como:

<file awk '
  BEGIN{srand(); n=rand()}
  {print n, NR, $0}
  !NF {n=rand()}
  END {if (NF) print n, NR+1, ""}' |
  sort -nk1 -k2 |
  cut -d' ' -f3-

Es decir, prefije cada línea con <a-random-number-that-changes-with-each-paragraph>el número de línea, luego ordene numéricamente el primer número y luego el segundo para mantener el orden de las líneas en los párrafos y eliminar esos números adicionales.

Es posible que desee conectarse para sed '$d'eliminar la línea en blanco final.

Tenga en cuenta que con la mayoría de awklas implementaciones srand()se utiliza la época de Unix para generar el generador de números pseudoaleatorios, por lo que puede obtener el mismo resultado si se ejecuta dos veces en el mismo segundo (unerror histórico ahora grabado en la especificación POSIX, desafortunadamente a pesar de mis esfuerzos).

Answer

POSIXly, podrías hacer algo como:

<file awk '
  BEGIN{srand(); n=rand()}
  {print n, NR, $0}
  !NF {n=rand()}
  END {if (NF) print n, NR+1, ""}' |
  sort -nk1 -k2 |
  cut -d' ' -f3-

Es decir, prefije cada línea con <a-random-number-that-changes-with-each-paragraph>el número de línea, luego ordene numéricamente el primer número y luego el segundo para mantener el orden de las líneas en los párrafos y eliminar esos números adicionales.

Es posible que desee conectarse para sed '$d'eliminar la línea en blanco final.

Tenga en cuenta que con la mayoría de awklas implementaciones srand()se utiliza la época de Unix para generar el generador de números pseudoaleatorios, por lo que puede obtener el mismo resultado si se ejecuta dos veces en el mismo segundo (unerror histórico ahora grabado en la especificación POSIX, desafortunadamente a pesar de mis esfuerzos).

Question 2

Usando herramientas GNU, esto divide los párrafos en grupos separados por NUL, los mezcla y luego elimina los NUL:

$ sed '1s/^/\n/; s/^$/\x00/' input | shuf -z | sed '1d; s/\x00//'
line 100
line 200

line 10
line 20
line 30

line 1
line 2

Enfoque alternativo sin utilizar NUL

Dado que no todas las herramientas admiten caracteres NUL, aquí tienes una alternativa. Esto lee los párrafos, sustituye ~las nuevas líneas, luego los mezcla y luego convierte el ~reverso en nuevas líneas antes de mostrar los resultados:

$ awk '{gsub(/\n/, "~")} 1' RS= input | shuf | awk '{gsub(/~/, "\n")} 1' ORS="\n\n"
line 10
line 20
line 30

line 100
line 200

line 1
line 2

Si su texto puede contener ~, utilice otro carácter que el texto no contendrá como separador de línea temporal.

Answer

Usando herramientas GNU, esto divide los párrafos en grupos separados por NUL, los mezcla y luego elimina los NUL:

$ sed '1s/^/\n/; s/^$/\x00/' input | shuf -z | sed '1d; s/\x00//'
line 100
line 200

line 10
line 20
line 30

line 1
line 2

Enfoque alternativo sin utilizar NUL

Dado que no todas las herramientas admiten caracteres NUL, aquí tienes una alternativa. Esto lee los párrafos, sustituye ~las nuevas líneas, luego los mezcla y luego convierte el ~reverso en nuevas líneas antes de mostrar los resultados:

$ awk '{gsub(/\n/, "~")} 1' RS= input | shuf | awk '{gsub(/~/, "\n")} 1' ORS="\n\n"
line 10
line 20
line 30

line 100
line 200

line 1
line 2

Si su texto puede contener ~, utilice otro carácter que el texto no contendrá como separador de línea temporal.

Question 3

Usando Perl:

perl -MList::Util -00 -e 'chomp(my @a=<>); print join("\n\n", List::Util::shuffle @a) . "\n";' < input

O distribuirlo como un archivo de script:

#!/usr/bin/perl
use List::Util 'shuffle';
local $/ = "";  ## paragraph mode
chomp(my @a = <>);
print join("\n\n", shuffle @a) . "\n";

Answer

Usando Perl:

perl -MList::Util -00 -e 'chomp(my @a=<>); print join("\n\n", List::Util::shuffle @a) . "\n";' < input

O distribuirlo como un archivo de script:

#!/usr/bin/perl
use List::Util 'shuffle';
local $/ = "";  ## paragraph mode
chomp(my @a = <>);
print join("\n\n", shuffle @a) . "\n";

Mezcla de archivos de varias líneas

Respuesta1

Respuesta2

Enfoque alternativo sin utilizar NUL

Respuesta3

información relacionada