Contraer algunas partes repetidas de líneas sucesivas

Contraer algunas partes repetidas de líneas sucesivas

Tengo datos en el bloc de notas como este:

4480-1
4480-2
4480-3
4480-15
4581-1
4581-2
4581-3
4581-4

¿Podemos hacerlo usando el tipo de bucle for? ¿Con sed?

Mi salida requerida es4480-1&-2&-3&-15&4581-1&-2&-3&-4

Respuesta1

Esto debería funcionar:

awk -F- '$1!=a{printf "%s", $1} {printf "-%s&", $2} {a=$1}' file | sed 's/&$/\n/g'

Fuera fuera:

4480-1&-2&-3&-15&4581-1&-2&-3&-4

Explicación:

  • awk -F-delimitador es-
  • $1!=a{printf "%s", $1}imprima la primera parte 4480si no es la misma que en la última línea procesada
  • {printf "-%s&", $2}imprimir la segunda parte con &al final
  • {a=$1}establecer a a la línea procesada
  • sed 's/&$/\n/g'elimine el último carácter que es a &y agregue una nueva línea

Respuesta2

No creo que puedas hacerlo sedfácilmente. Es más fácil con perl:

$ perl -F'-' -anle '
    $h{$F[0]} .= defined($h{$F[0]}) ? "&-".$F[1] : "-".$F[1];
    END {
        $,="&";
        print @{[map { $_.$h{$_} } sort { $a <=> $b } keys %h]}
    }
' file
4480-1&-2&-3&-15&4581-1&-2&-3&-4

Respuesta3

Probablemente no sea posible con sed. Lo estoy haciendo con AWK. Asumo una entrada por línea.

awk '
  BEGIN { FS="-"; ORS=""; left="" }

  {
    if(NR>1){print "&"}

    # Only print left part if it differs from previous line
    if ($1!=left) {
      print $1 "-" $2
      left=$1;
    } else {
      print "-" $2
    }
  }' inputfile.txt

Salidas4480-1&-2&-3&-15&4581-1&-2&-3&-4

Respuesta4

Debería ser sed, sin embargo aquí está perl:

#!/usr/bin/perl

while ( ($a,$b) = split /-/,<>) { $n->{$a}->{"-$b"}++;}

@_ = map { $_,
           map { chomp; "$_&"; } reverse sort { $a <=> $b } keys $n->{$_};
     } sort { $a <=> $b } keys $n;

@_[-1] =~ s/&$//;

print @_;

Salida ordenada numéricamente, independientemente del orden de entrada:

4480-1&-2&-3&-15&4581-1&-2&-3&-4

información relacionada