Zählen Sie die Anzahl der Zeilen mit einer bestimmten Anzahl von Spalten

Question 1

Awk ist dafür perfekt geeignet. Es trennt Zeilen an Leerzeichen (standardmäßig; kann mit der -FOption geändert werden) und die interne Variable NF(Anzahl der Felder) enthält die Anzahl der Felder pro Zeile. Gehen Sie also einfach die Datei durch und speichern Sie NFfür jede Zeile:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

Der obige Code speichert einfach die Anzahl der Felder ( NF) im assoziativen Array, numsdessen Schlüssel die Anzahl der Felder und dessen Werte die Anzahl der Vorkommen dieser Spaltenanzahl in der Datei sind. Am Ende gehen wir einfach das Array durch und drucken. Wenn wir das Obige auf Ihr Beispiel anwenden, ergibt sich:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Ein (kleiner) Nachteil dieses Ansatzes ist, dass Sie für jede Zeile der Datei einen Eintrag im Speicher behalten müssen. Das ist kein Problem, es sei denn, Ihre Datei ist absolut riesig oder Sie haben extrem wenig Speicher zur Verfügung. Wenn das aber der Fall ist, können Sie es umgehen, indem Sie einfach die Anzahl der Felder pro Zeile ausdrucken und dann zählen:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Oder um die gleiche Ausgabe zu erhalten:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer

Awk ist dafür perfekt geeignet. Es trennt Zeilen an Leerzeichen (standardmäßig; kann mit der -FOption geändert werden) und die interne Variable NF(Anzahl der Felder) enthält die Anzahl der Felder pro Zeile. Gehen Sie also einfach die Datei durch und speichern Sie NFfür jede Zeile:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

Der obige Code speichert einfach die Anzahl der Felder ( NF) im assoziativen Array, numsdessen Schlüssel die Anzahl der Felder und dessen Werte die Anzahl der Vorkommen dieser Spaltenanzahl in der Datei sind. Am Ende gehen wir einfach das Array durch und drucken. Wenn wir das Obige auf Ihr Beispiel anwenden, ergibt sich:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Ein (kleiner) Nachteil dieses Ansatzes ist, dass Sie für jede Zeile der Datei einen Eintrag im Speicher behalten müssen. Das ist kein Problem, es sei denn, Ihre Datei ist absolut riesig oder Sie haben extrem wenig Speicher zur Verfügung. Wenn das aber der Fall ist, können Sie es umgehen, indem Sie einfach die Anzahl der Felder pro Zeile ausdrucken und dann zählen:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Oder um die gleiche Ausgabe zu erhalten:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Question 2

Eine Nicht- awkLösung, vielleicht etwas umständlich:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Answer

Eine Nicht- awkLösung, vielleicht etwas umständlich:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Zählen Sie die Anzahl der Zeilen mit einer bestimmten Anzahl von Spalten

Antwort1

Antwort2

verwandte Informationen