sedコマンドの説明

Question 1

コマンド

sed -e 's/\(.\)/\1\n/g'

は、すべての文字をその文字自体に置き換え、その後に改行文字が続く単一の GNUsed置換コマンドです。これにより、入力が単一の文字の 1 列に折り畳まれます。

$ echo hello | sed -e 's/\(.\)/\1\n/g'
h
e
l
l
o

は\(.\)「キャプチャグループ」であり、1 つの文字をキャプチャします。は\1最初のキャプチャグループへの「後方参照」です。\1を置換テキストで使用すると、最初の括弧でキャプチャされたものが挿入されます。

バックスラッシュをあまり使わずに次のように書くこともできます。

sed 's/./&\n/g'

ここで、&単に「表現に一致したもの」を意味します。

このsedコマンドは GNUsed標準を必要とし、このようsedにして改行を挿入することはできません\n。

標準ツールでより効率的に行うには、

fold -w 1

代わりに、入力内の各文字に対して正規表現のマッチングを行う必要がないため、より効率的です。

を使用するとfold、パイプラインは次のように記述できます。

grep -v '^>' file | tr -d '\n' | fold -w 1 | sort | uniq -c | sort -rn

あるいは、awkパイプラインのいくつかのステップを削除するために、

awk '!/^>/ { for (i = 1; i <= length; ++i) count[substr($0,i,1)]++ }
    END { for (ch in count) print count[ch], ch }' file |
sort -rn

このawkコードは、各文字が出現した回数をカウントします。これは、count入力ストリーム内の各文字に対応する配列の値を増分することによって行われます。入力の最後に、カウントされた回数と文字数の概要が出力されます。

Answer

コマンド

sed -e 's/\(.\)/\1\n/g'

は、すべての文字をその文字自体に置き換え、その後に改行文字が続く単一の GNUsed置換コマンドです。これにより、入力が単一の文字の 1 列に折り畳まれます。

$ echo hello | sed -e 's/\(.\)/\1\n/g'
h
e
l
l
o

は\(.\)「キャプチャグループ」であり、1 つの文字をキャプチャします。は\1最初のキャプチャグループへの「後方参照」です。\1を置換テキストで使用すると、最初の括弧でキャプチャされたものが挿入されます。

バックスラッシュをあまり使わずに次のように書くこともできます。

sed 's/./&\n/g'

ここで、&単に「表現に一致したもの」を意味します。

このsedコマンドは GNUsed標準を必要とし、このようsedにして改行を挿入することはできません\n。

標準ツールでより効率的に行うには、

fold -w 1

代わりに、入力内の各文字に対して正規表現のマッチングを行う必要がないため、より効率的です。

を使用するとfold、パイプラインは次のように記述できます。

grep -v '^>' file | tr -d '\n' | fold -w 1 | sort | uniq -c | sort -rn

あるいは、awkパイプラインのいくつかのステップを削除するために、

awk '!/^>/ { for (i = 1; i <= length; ++i) count[substr($0,i,1)]++ }
    END { for (ch in count) print count[ch], ch }' file |
sort -rn

このawkコードは、各文字が出現した回数をカウントします。これは、count入力ストリーム内の各文字に対応する配列の値を増分することによって行われます。入力の最後に、カウントされた回数と文字数の概要が出力されます。

Question 2

これでより明確になったと思います。

「3つの代替コマンドで構成されていることはわかっています」

これは単なる 1 つの代替コマンドです (コマンドを参照している場合sed)。s/<pattern to search>/<replacement>/これは以下を実行します。

各行でを検索し<pattern>、に置き換えます<replacement>。
旗gの意味はやれグ局所的にデフォルトではsedの最初の出現部分のみが置き換えられるためです<pattern>。

「でも、私は迷っています/\1\」

パターンをキャプチャするには、エスケープされた括弧で囲むか、オプション\(<pattern>\)を使用して括弧のみを使用します。-E(<pattern>)

セクションでは、<replacement>このキャプチャされたパターンはバックスラッシュと数字で参照されます。\<number>数字はキャプチャの位置を示します。複数のキャプチャがある場合があるためです。

sed -E '/(<first capture>)(<second capture>)/\1\2/'

したがって、コマンドのsed -e 's/\(.\)/\1\n/g'意味は次のとおりです。

すべての文字をキャプチャし\(.\)、それをそれ自体と新しい行に置き換えます\1\n。
ではg、最初の出現で停止せずに、グローバルに実行します。

例えば：

$ echo foo | sed -E 's/(.)/\1\n/g'
f
o
o

複数のコマンドを連結する場合を除き、ここでオプション-eは必要ありませんsed: sed -e '...' -e '...'、など。

詳細は以下をご覧ください。後方参照と部分式。

Answer