コマンドラインツールを使用してソートされたシーケンス内の重複をカウントする

Question 1

出力が少し異なる形式であっても処理できる場合は、次のようにします。

cmd1 | tr " " "\n" | uniq -c

返される結果は次のとおりです:

Answer

出力が少し異なる形式であっても処理できる場合は、次のようにします。

cmd1 | tr " " "\n" | uniq -c

返される結果は次のとおりです:

Question 2

また、-u スイッチを追加します。次のようになります。

cmd1 | sort -gru

sort のマニュアルページから:

-u、--unique を
-c なしで実行すると、等しい実行の最初のものだけを出力します。

Answer

また、-u スイッチを追加します。次のようになります。

cmd1 | sort -gru

sort のマニュアルページから:

-u、--unique を
-c なしで実行すると、等しい実行の最初のものだけを出力します。

Question 3

(sort の出力は 1 行に 1 つの数値なので、入力は 1 行に 1 つの数値であると想定しています。)

awk を試すこともできます:

<your_command> | awk '{numbers[$1]++} END {for (number in numbers) print number " " numbers[number]}'

これにより、ソートされていないリストが生成されます (私の知る限り、awk で配列が処理される順序は未定義です)。そのため、好みに応じて再度ソートする必要があります。

Answer

(sort の出力は 1 行に 1 つの数値なので、入力は 1 行に 1 つの数値であると想定しています。)

awk を試すこともできます:

<your_command> | awk '{numbers[$1]++} END {for (number in numbers) print number " " numbers[number]}'

これにより、ソートされていないリストが生成されます (私の知る限り、awk で配列が処理される順序は未定義です)。そのため、好みに応じて再度ソートする必要があります。

Question 4

$ echo '100 100 100 99 99 26 25 24 24' | perl -e 'while (<>) { chomp; my %nums; foreach (split(/ /)) { $nums{$_} += 1; }; foreach (sort {$b <=> $a} keys %nums) { print "$_ $nums{$_} " }; print "\n"; }'
100 3 99 2 26 1 25 1 24 2

Answer

$ echo '100 100 100 99 99 26 25 24 24' | perl -e 'while (<>) { chomp; my %nums; foreach (split(/ /)) { $nums{$_} += 1; }; foreach (sort {$b <=> $a} keys %nums) { print "$_ $nums{$_} " }; print "\n"; }'
100 3 99 2 26 1 25 1 24 2

コマンドラインツールを使用してソートされたシーケンス内の重複をカウントする

答え1

答え2

答え3

答え4

関連情報