filtrando dados com base no delimitador no shell

Question 1

Se você tiver grepcom pcreopção:

$ grep -oP '\|\K[^|]+(?=\|)' ip.txt | sort -u
a4-123
b4-124
bad-girl
dummy
good-guy
hello
hub
lab
lol
short
wow
yes
yoo

-oimprimir apenas o padrão correspondente
-Pusar pcre regex
\|\Klookbehind positivo para ver se |existe antes de nossa string ser extraída
- da mesma forma, (?=\|)lookahead positivo para ver se existe |depois de nossa string ser extraída
[^|]+string a ser extraída - simplesmente negue |e obtenha um ou mais desses caracteres
sort -upara obter um valor único

Se você quiser preservar a ordem em que essas strings são encontradas:

$ grep -oP '\|\K[^|]+(?=\|)' ip.txt | awk '!seen[$0]++'
yoo
dummy
yes
wow
hub
lab
short
hello
good-guy
bad-girl
lol
a4-123
b4-124

Answer

Se você tiver grepcom pcreopção:

$ grep -oP '\|\K[^|]+(?=\|)' ip.txt | sort -u
a4-123
b4-124
bad-girl
dummy
good-guy
hello
hub
lab
lol
short
wow
yes
yoo

-oimprimir apenas o padrão correspondente
-Pusar pcre regex
\|\Klookbehind positivo para ver se |existe antes de nossa string ser extraída
- da mesma forma, (?=\|)lookahead positivo para ver se existe |depois de nossa string ser extraída
[^|]+string a ser extraída - simplesmente negue |e obtenha um ou mais desses caracteres
sort -upara obter um valor único

Se você quiser preservar a ordem em que essas strings são encontradas:

$ grep -oP '\|\K[^|]+(?=\|)' ip.txt | awk '!seen[$0]++'
yoo
dummy
yes
wow
hub
lab
short
hello
good-guy
bad-girl
lol
a4-123
b4-124

Question 2

Se você não se importa com a ordem, você pode usar um hash perl para garantir a exclusividade, por exemplo

$ perl -lne '$h{$_}++ for /(?<=\|).*?(?=\|)/g; END{print for keys %h}' file
short
b4-124
lol
yes
bad-girl
lab
yoo
good-guy
hub
dummy
hello
a4-123
wow

Vercriando um hash com correspondências regex em perl

Answer

Se você não se importa com a ordem, você pode usar um hash perl para garantir a exclusividade, por exemplo

$ perl -lne '$h{$_}++ for /(?<=\|).*?(?=\|)/g; END{print for keys %h}' file
short
b4-124
lol
yes
bad-girl
lab
yoo
good-guy
hub
dummy
hello
a4-123
wow

Vercriando um hash com correspondências regex em perl

Question 3

e o seguinte?

cut file -d'|' -f2,3,4 | tr '|' '\n'

O comando acima imprimirá um número fixo de colunas (3). Se você deseja imprimir um número variável de colunas, até a primeira ocorrência de /, você pode usar algo como:

cut -d'/' -f1 file | cut  -d'|' -f2- | tr '|' '\n'

Answer

e o seguinte?

cut file -d'|' -f2,3,4 | tr '|' '\n'

O comando acima imprimirá um número fixo de colunas (3). Se você deseja imprimir um número variável de colunas, até a primeira ocorrência de /, você pode usar algo como:

cut -d'/' -f1 file | cut  -d'|' -f2- | tr '|' '\n'

Question 4

Sua saída tem repetição "fictícia". Isso é o que recebo com o script abaixo -

   awk -f f1.awk /tmp/f1
    short
    hub
    wow
    hello
    a4-123
    b4-124
    yes
    yoo
    lol
    bad-girl
    good-guy
    lab
    dummy

    cat f1.awk 
    {
      n=split($1,a,"|")

      for(i=2; i<n; i++) {
        arr[a[i]] = a[i] 
      } 
    }   
    END{
      for (var in arr) 
        print(var)  
    }

Answer

Sua saída tem repetição "fictícia". Isso é o que recebo com o script abaixo -

   awk -f f1.awk /tmp/f1
    short
    hub
    wow
    hello
    a4-123
    b4-124
    yes
    yoo
    lol
    bad-girl
    good-guy
    lab
    dummy

    cat f1.awk 
    {
      n=split($1,a,"|")

      for(i=2; i<n; i++) {
        arr[a[i]] = a[i] 
      } 
    }   
    END{
      for (var in arr) 
        print(var)  
    }

filtrando dados com base no delimitador no shell

Responder1

Responder2

Responder3

Responder4

informação relacionada