列をシフトした累積合計

Question 1

どうぞ：

$ awk -F+ '{sum+=$2;printf("%s+%d\n",$1,sum-$2);}' blah.txt
aa+0
bb+2
cc+6
dd+16

編集1: Sukminderのおかげで、もう少し簡単な方法ができました

$ awk -F+ '{printf("%s+%d\n",$1,sum);sum+=$2}' blah.txt

編集2: もう少し簡潔に、Bernhard に感謝します:

$ awk -F+ '{print $1,sum;sum+=$2}' OFS="+" blah.txt

編集3: しかし、前者では最初の行に 0 が表示されないので、ここでは、トムの質問に回答するためのより短い方法を示す、修正され、やや圧縮されたバージョンを示します (新しいコメントでより良い方法が提案されるまで)。

$ awk -F+ '{print$1,s+0;s+=$2}' OFS=+ blah.txt

Answer

どうぞ：

$ awk -F+ '{sum+=$2;printf("%s+%d\n",$1,sum-$2);}' blah.txt
aa+0
bb+2
cc+6
dd+16

編集1: Sukminderのおかげで、もう少し簡単な方法ができました

$ awk -F+ '{printf("%s+%d\n",$1,sum);sum+=$2}' blah.txt

編集2: もう少し簡潔に、Bernhard に感謝します:

$ awk -F+ '{print $1,sum;sum+=$2}' OFS="+" blah.txt

編集3: しかし、前者では最初の行に 0 が表示されないので、ここでは、トムの質問に回答するためのより短い方法を示す、修正され、やや圧縮されたバージョンを示します (新しいコメントでより良い方法が提案されるまで)。

$ awk -F+ '{print$1,s+0;s+=$2}' OFS=+ blah.txt

Question 2

そのための最善の方法は、正規表現を学んで使用することです。そうすれば、将来、そのようなことを行う際に多くのトラブルを回避できます。

cat blah.txt | gawk 'match($0, /([^0-9]*)([0-9]+)/, ary) {print ary[1] ary[2]-2}'

最後の 2 つをシフト変数に置き換える必要があります。の使用法に注意してくださいgawk。私の知る限り、regular はawk正規表現からグループを抽出できません。

これは何をするのでしょうか?正規表現を使用してに一致し$0、結果をに入れます。これは、次と一致します: - 0 個以上の数字以外の文字に一致し、それを最初の配列インデックスに配置します (括弧はグループ化と呼ばれる処理を担当します)。次に、長さが 0 以外の数値に一致し (それを配列の 2 番目の要素として配置します)。ary/([^0-9]*)([0-9]+)/([^0-9]*)([0-9]+)

もちろん、エラーチェックやマッチングの特殊なケースなどを追加して、これをさらに複雑にすることもできますが、これ (つまり正規表現) については自分で調べてみることをお勧めします。

Answer

そのための最善の方法は、正規表現を学んで使用することです。そうすれば、将来、そのようなことを行う際に多くのトラブルを回避できます。

cat blah.txt | gawk 'match($0, /([^0-9]*)([0-9]+)/, ary) {print ary[1] ary[2]-2}'

最後の 2 つをシフト変数に置き換える必要があります。の使用法に注意してくださいgawk。私の知る限り、regular はawk正規表現からグループを抽出できません。

これは何をするのでしょうか?正規表現を使用してに一致し$0、結果をに入れます。これは、次と一致します: - 0 個以上の数字以外の文字に一致し、それを最初の配列インデックスに配置します (括弧はグループ化と呼ばれる処理を担当します)。次に、長さが 0 以外の数値に一致し (それを配列の 2 番目の要素として配置します)。ary/([^0-9]*)([0-9]+)/([^0-9]*)([0-9]+)

もちろん、エラーチェックやマッチングの特殊なケースなどを追加して、これをさらに複雑にすることもできますが、これ (つまり正規表現) については自分で調べてみることをお勧めします。

列をシフトした累積合計

答え1

答え2

関連情報