'x'회 이상 0을 포함하는 행 삭제

Question 1

를 사용하면 awk -F',0'의 사본 3개가 ,03개로 간주됩니다.구분 기호, 4개 제공필드전체적으로. 따라서 대신 사용하면 awk -F',0' 'NF<5 {print}'출력에 올바른 줄이 표시됩니다.

,0213,0123은 0 구분 기호로 사용하거나 사용하지 않을 수도 있는 와 같은 문자열과도 일치합니다 .

따라서 ,필드 구분 기호로 사용하여 0이 하나만 있는 필드의 수를 계산할 수도 있습니다.

awk -F, '{z=0; for (i = 1 ; i <= NF ; i++) if ($i == 0) z++} z <= 4' file.csv

Answer

를 사용하면 awk -F',0'의 사본 3개가 ,03개로 간주됩니다.구분 기호, 4개 제공필드전체적으로. 따라서 대신 사용하면 awk -F',0' 'NF<5 {print}'출력에 올바른 줄이 표시됩니다.

,0213,0123은 0 구분 기호로 사용하거나 사용하지 않을 수도 있는 와 같은 문자열과도 일치합니다 .

따라서 ,필드 구분 기호로 사용하여 0이 하나만 있는 필드의 수를 계산할 수도 있습니다.

awk -F, '{z=0; for (i = 1 ; i <= NF ; i++) if ($i == 0) z++} z <= 4' file.csv

Question 2

정규식과 를 사용하여 문제를 해결할 수도 있습니다 grep.

grep -Ev '(,0(,[^0,]+)*){4,}' file.csv

이 파일에서 테스트했습니다.

gene,v1,v2,v3,v4,v5,v6,v7
gene1,0,1,5,0,0,4,100
gene2,1,0,0,0,5,210,2
gene3,0,0,0,0,6,0,0
gene4,0,0,0,4,6,0,0
gene5,0,1,0,4,6,0,0

몇 가지 가정이 있습니다:

0이 아닌 숫자는 0으로 시작하지 않습니다.
0의 숫자에는 0이 하나만 포함됩니다.
모든 숫자는 정수입니다.

필요한 경우 정규식을 확장하여 이러한 경우를 해결할 수 있습니다.

Answer

정규식과 를 사용하여 문제를 해결할 수도 있습니다 grep.

grep -Ev '(,0(,[^0,]+)*){4,}' file.csv

이 파일에서 테스트했습니다.

gene,v1,v2,v3,v4,v5,v6,v7
gene1,0,1,5,0,0,4,100
gene2,1,0,0,0,5,210,2
gene3,0,0,0,0,6,0,0
gene4,0,0,0,4,6,0,0
gene5,0,1,0,4,6,0,0

몇 가지 가정이 있습니다:

0이 아닌 숫자는 0으로 시작하지 않습니다.
0의 숫자에는 0이 하나만 포함됩니다.
모든 숫자는 정수입니다.

필요한 경우 정규식을 확장하여 이러한 경우를 해결할 수 있습니다.

Question 3

KISS 접근 방식awk

awk -F, '{c = 0; for(i=1; i<=NF; i++) {c += $i == "0" ? 1 : 0}} c <= 3' file.csv
    gene,v1,v2,v3,v4,v5,v6,v7
    gene1,0,1,5,0,0,4,100
    gene2,1,0,0,0,5,210,2

와 함께perl

perl -F, -ne 'print unless (grep { $_ eq "0" } @F) > 3' file.csv
    gene,v1,v2,v3,v4,v5,v6,v7
    gene1,0,1,5,0,0,4,100
    gene2,1,0,0,0,5,210,2

Answer

KISS 접근 방식awk

awk -F, '{c = 0; for(i=1; i<=NF; i++) {c += $i == "0" ? 1 : 0}} c <= 3' file.csv
    gene,v1,v2,v3,v4,v5,v6,v7
    gene1,0,1,5,0,0,4,100
    gene2,1,0,0,0,5,210,2

와 함께perl

perl -F, -ne 'print unless (grep { $_ eq "0" } @F) > 3' file.csv
    gene,v1,v2,v3,v4,v5,v6,v7
    gene1,0,1,5,0,0,4,100
    gene2,1,0,0,0,5,210,2

Question 4

모든 숫자가 정수인 경우 다음을 사용합니다.암소 비슷한 일종의 영양 awk단어 경계를 지원하는 것은 \<...\>할 수 있습니다

gawk 'gsub(/\<0\>/, "0") <5' infile

Answer

모든 숫자가 정수인 경우 다음을 사용합니다.암소 비슷한 일종의 영양 awk단어 경계를 지원하는 것은 \<...\>할 수 있습니다

gawk 'gsub(/\<0\>/, "0") <5' infile

'x'회 이상 0을 포함하는 행 삭제

답변1

답변2

답변3

답변4

관련 정보