Recolher algumas partes repetidas de linhas sucessivas

Recolher algumas partes repetidas de linhas sucessivas

Eu tenho dados no bloco de notas assim:

4480-1
4480-2
4480-3
4480-15
4581-1
4581-2
4581-3
4581-4

Podemos fazer isso usando coisas do tipo loop for? Com sed?

Minha saída necessária é4480-1&-2&-3&-15&4581-1&-2&-3&-4

Responder1

Isso deve funcionar:

awk -F- '$1!=a{printf "%s", $1} {printf "-%s&", $2} {a=$1}' file | sed 's/&$/\n/g'

Fora fora:

4480-1&-2&-3&-15&4581-1&-2&-3&-4

Explicação:

  • awk -F-delimitador é-
  • $1!=a{printf "%s", $1}imprima a primeira parte 4480se não for igual à última linha processada
  • {printf "-%s&", $2}imprima a segunda parte com &no final
  • {a=$1}definir a para a linha processada
  • sed 's/&$/\n/g'remova o último caractere que é a &e adicione uma nova linha

Responder2

Eu não acho que você possa fazer isso sedfacilmente. É mais fácil com perl:

$ perl -F'-' -anle '
    $h{$F[0]} .= defined($h{$F[0]}) ? "&-".$F[1] : "-".$F[1];
    END {
        $,="&";
        print @{[map { $_.$h{$_} } sort { $a <=> $b } keys %h]}
    }
' file
4480-1&-2&-3&-15&4581-1&-2&-3&-4

Responder3

Provavelmente não é possível com sed. Estou fazendo com AWK. Presumo uma entrada por linha.

awk '
  BEGIN { FS="-"; ORS=""; left="" }

  {
    if(NR>1){print "&"}

    # Only print left part if it differs from previous line
    if ($1!=left) {
      print $1 "-" $2
      left=$1;
    } else {
      print "-" $2
    }
  }' inputfile.txt

Resultados4480-1&-2&-3&-15&4581-1&-2&-3&-4

Responder4

Deveria ser sed, porém aqui está o perl:

#!/usr/bin/perl

while ( ($a,$b) = split /-/,<>) { $n->{$a}->{"-$b"}++;}

@_ = map { $_,
           map { chomp; "$_&"; } reverse sort { $a <=> $b } keys $n->{$_};
     } sort { $a <=> $b } keys $n;

@_[-1] =~ s/&$//;

print @_;

saída classificada numericamente, independentemente da ordem de entrada:

4480-1&-2&-3&-15&4581-1&-2&-3&-4

informação relacionada