Contar números diferentes de zero para cada linha de uma segunda coluna em um arquivo de texto

Question 1

Você pode usar a -copção grep. E você pode remover todos os caracteres até a primeira vírgula e tudo a partir da segunda vírgula com sed:

sed 's/^[^,]*,//;s/,.*//' < the_file | grep -c -E '[^0]'

EDIT: Este sedcomando faz o mesmo que o seu cutcomando, então você também deve poder usar o grepcomando original.

EDIT2: Se você quiser usar apenas um comando, você pode usar a resposta @cuonglm grp. Se você quiser usar apenasuma invocaçãodisso sedserá muito trabalho com rótulos para resumir a contagem de linhas no final.

sed -E -n '
    s/^[^,]*,[^0,]+,.*/+1/   # replace the lines we are interested in with "+1"
    T delete_line            # if we did not do a substitution right now we jump to "delete_line"
    H                        # we did not jump (so we did the substitution and append the "+1" to the hold space
    : delete_line            # the label, here we do nothing (silently drop the current line)
    $ {                      # on the last line we ...
        s/.*/0/              # replace the whole line with "0"
        G                    # append the hold space (all the "+1" from before")
        s/\n//g              # remove all newlines
        p                    # print the line
    }' < the_file

Agora isso pode ser canalizado bcou você pode substituir o pcomando por alguma mágica complicada sedpara resumir esses números em sed. Acredito ter ouvido dizer que seda operação está completa, então deveria ser possível.

Se você quiser usar apenasum programa( sed) mas não se preocupe em invocá-lo várias vezes é muito mais fácil:

sed '/^[^,]*,0,.*/d' < the_file | sed -n '$='

Answer

Você pode usar a -copção grep. E você pode remover todos os caracteres até a primeira vírgula e tudo a partir da segunda vírgula com sed:

sed 's/^[^,]*,//;s/,.*//' < the_file | grep -c -E '[^0]'

EDIT: Este sedcomando faz o mesmo que o seu cutcomando, então você também deve poder usar o grepcomando original.

EDIT2: Se você quiser usar apenas um comando, você pode usar a resposta @cuonglm grp. Se você quiser usar apenasuma invocaçãodisso sedserá muito trabalho com rótulos para resumir a contagem de linhas no final.

sed -E -n '
    s/^[^,]*,[^0,]+,.*/+1/   # replace the lines we are interested in with "+1"
    T delete_line            # if we did not do a substitution right now we jump to "delete_line"
    H                        # we did not jump (so we did the substitution and append the "+1" to the hold space
    : delete_line            # the label, here we do nothing (silently drop the current line)
    $ {                      # on the last line we ...
        s/.*/0/              # replace the whole line with "0"
        G                    # append the hold space (all the "+1" from before")
        s/\n//g              # remove all newlines
        p                    # print the line
    }' < the_file

Agora isso pode ser canalizado bcou você pode substituir o pcomando por alguma mágica complicada sedpara resumir esses números em sed. Acredito ter ouvido dizer que seda operação está completa, então deveria ser possível.

Se você quiser usar apenasum programa( sed) mas não se preocupe em invocá-lo várias vezes é muito mais fácil:

sed '/^[^,]*,0,.*/d' < the_file | sed -n '$='

Question 2

Com grep:

grep -c '^[^,]*,[^0]' <file

Isso só funciona se a segunda coluna for formada como número inteiro, mas não -0,. +0Para um caso mais geral, consulteResposta de @Stéphane Chazelas.

Answer

Com grep:

grep -c '^[^,]*,[^0]' <file

Isso só funciona se a segunda coluna for formada como número inteiro, mas não -0,. +0Para um caso mais geral, consulteResposta de @Stéphane Chazelas.

Question 3

grep -c '^[^,]*,[-+0-9.]*[1-9]'

Isso deve abranger números expressos como 12, -1, 0e+12, 01, 0.0001. Mas não para 0xFFou Infou NaNpor exemplo, então isso ainda seria diferente do mais canônico:

POSIXLY_CORRECT=1 awk -v n=0 -F , '$2 != 0 {n++}; END{print n}'

Se sua entrada tiver números expressos nesse formato.

Para uma sedúnica solução, você poderia fazer:

sed '/^[^,]*,[-+0-9]*[1-9]/!d' | sed -n '$='

Mas para uma solução com apenas uma sedinvocação, precisaríamos fazer a aritmética manualmente.

sed -n '
  1{x;s/$/0,:0123456789,0/;x;}
  /^[^,]*,[-+0-9]*[1-9]/ {
    x;:1
    s/^,/1/;s/\(.\),\(.*:.*\1\(,*.\)\)/\3\2/;t1
    s/:/,:/
    x
  }
  ${x;s/,.*//p;}'

Answer

grep -c '^[^,]*,[-+0-9.]*[1-9]'

Isso deve abranger números expressos como 12, -1, 0e+12, 01, 0.0001. Mas não para 0xFFou Infou NaNpor exemplo, então isso ainda seria diferente do mais canônico:

POSIXLY_CORRECT=1 awk -v n=0 -F , '$2 != 0 {n++}; END{print n}'

Se sua entrada tiver números expressos nesse formato.

Para uma sedúnica solução, você poderia fazer:

sed '/^[^,]*,[-+0-9]*[1-9]/!d' | sed -n '$='

Mas para uma solução com apenas uma sedinvocação, precisaríamos fazer a aritmética manualmente.

sed -n '
  1{x;s/$/0,:0123456789,0/;x;}
  /^[^,]*,[-+0-9]*[1-9]/ {
    x;:1
    s/^,/1/;s/\(.\),\(.*:.*\1\(,*.\)\)/\3\2/;t1
    s/:/,:/
    x
  }
  ${x;s/,.*//p;}'

Contar números diferentes de zero para cada linha de uma segunda coluna em um arquivo de texto

Responder1

Responder2

Responder3

informação relacionada