部分文字列を特定の値に置き換えるawkコマンド

Question 1

2 つの部分文字列を印刷する必要があります。1 つはその位置の前の部分、もう 1 つはその位置の後の部分です。次のようになります。

$ awk -v dummy='0123456789' -v start=314 -v len=10 '
{ print substr($0, 1, start-1) dummy substr($0, start+len) }' infile >outfile

テスト:

$ awk -v dummy='0123456789' -v start=4 -v len=10 '
{ print substr($0, 1, start-1) dummy substr($0, start+len) }' <<<'0009876543210999'
0000123456789999

コマンドに関する問題:

gsub() の 3 番目の引数での$var代わりにを使用すると、gsub() は、その番号が 10 桁の長さのフィールド番号の値であるフィールドを検索するため、awk はそのフィールド #xxxxxxxxxxxx に対して gsub() を試行しますが、これらの非常に膨大な数のフィールドを再評価するためのメモリ割り当てが原因で失敗します (gsub() の 3 番目の引数以外のフィールドを使用すると、awk はフィールドをデフォルトの OFS に再構築するように強制されるため)。varvar$0
問題 1 を修正すると、var変数内のすべての数字が文字列に置き換えられます1234567890。
その後、printこれを使用すると、更新を行わないため、現在の行が変更なしで印刷されます。

Answer

2 つの部分文字列を印刷する必要があります。1 つはその位置の前の部分、もう 1 つはその位置の後の部分です。次のようになります。

$ awk -v dummy='0123456789' -v start=314 -v len=10 '
{ print substr($0, 1, start-1) dummy substr($0, start+len) }' infile >outfile

テスト:

$ awk -v dummy='0123456789' -v start=4 -v len=10 '
{ print substr($0, 1, start-1) dummy substr($0, start+len) }' <<<'0009876543210999'
0000123456789999

コマンドに関する問題:

gsub() の 3 番目の引数での$var代わりにを使用すると、gsub() は、その番号が 10 桁の長さのフィールド番号の値であるフィールドを検索するため、awk はそのフィールド #xxxxxxxxxxxx に対して gsub() を試行しますが、これらの非常に膨大な数のフィールドを再評価するためのメモリ割り当てが原因で失敗します (gsub() の 3 番目の引数以外のフィールドを使用すると、awk はフィールドをデフォルトの OFS に再構築するように強制されるため)。varvar$0
問題 1 を修正すると、var変数内のすべての数字が文字列に置き換えられます1234567890。
その後、printこれを使用すると、更新を行わないため、現在の行が変更なしで印刷されます。

Question 2

sed代わりにを使用することもできますawk。こちらの方が冗長性は低くなります。

$ sed -E 's/^(.{313})[0-9]{10}/\10123456789/' infile
<313 chars>1234567890

Answer

sed代わりにを使用することもできますawk。こちらの方が冗長性は低くなります。

$ sed -E 's/^(.{313})[0-9]{10}/\10123456789/' infile
<313 chars>1234567890

Question 3

awkの代わりにperlを使うこともできます。例:

perl -p -e 'substr($_,313,10) = "1234567890"' final_phone.txt >final_phone.txt1

注意: perl のsubstr関数では、オフセットは 1 ではなく 0 から始まります。したがって、オフセット 313 は 314 番目の文字です。perldoc -f substr詳細については、を参照してください。

Answer

awkの代わりにperlを使うこともできます。例:

perl -p -e 'substr($_,313,10) = "1234567890"' final_phone.txt >final_phone.txt1

注意: perl のsubstr関数では、オフセットは 1 ではなく 0 から始まります。したがって、オフセット 313 は 314 番目の文字です。perldoc -f substr詳細については、を参照してください。

部分文字列を特定の値に置き換えるawkコマンド

答え1

答え2

答え3

関連情報