awk を使用して新しいファイルを作成すると、特定の 1 つの列を使用するときに問題が発生しますが、何が間違っているのかわかりません。

Question 1

dosスタイル行末付き:

$ cat -e ip.txt 
    MT      200610-1        100     2757^M$
    MT      200610-10       100     6753 ^M$
    MT      200610-100      100     15173^M$

$ awk 'BEGIN{FS=="\t";OFS=="\t"}{print "chr"$1,$4-1,$4}' ip.txt 
chrMT 2756 2757
chrMT 6752 6753
chrMT 15172 15173

$ awk 'BEGIN{FS=="\t";OFS=="\t"}{print "chr"$1,$4-1,$4,$2}' ip.txt 
 200610-16 2757
chrMT 6752 6753 200610-10
 200610-100 15173

スタイルの行末と必要な出力のperl両方を処理するには、次のようにします。dos

$ perl -lane 'print "chr$F[0]\t", $F[3]-1, "\t$F[3]\t$F[1]"' ip.txt 
chrMT   2756    2757    200610-1
chrMT   6752    6753    200610-10
chrMT   15172   15173   200610-100

では、まずawk行末をスタイルに変更し、可能な場合はで変更するか、unixdos2unixperl

$ perl -i -pe 's|\r\n|\n|' ip.txt 
$ cat -e ip.txt 
    MT      200610-1        100     2757$
    MT      200610-10       100     6753 $
    MT      200610-100      100     15173$

その後

$ awk -v OFS='\t' '{print "chr"$1,$4-1,$4,$2}' ip.txt 
chrMT   2756    2757    200610-1
chrMT   6752    6753    200610-10
chrMT   15172   15173   200610-100

または、を使ってGNU awk、入力レコードをDOS形式の行末処理するように設定する

gawk -v RS='\r\n' -v OFS='\t' '{print "chr"$1,$4-1,$4,$2}' ip.txt

Answer

dosスタイル行末付き:

$ cat -e ip.txt 
    MT      200610-1        100     2757^M$
    MT      200610-10       100     6753 ^M$
    MT      200610-100      100     15173^M$

$ awk 'BEGIN{FS=="\t";OFS=="\t"}{print "chr"$1,$4-1,$4}' ip.txt 
chrMT 2756 2757
chrMT 6752 6753
chrMT 15172 15173

$ awk 'BEGIN{FS=="\t";OFS=="\t"}{print "chr"$1,$4-1,$4,$2}' ip.txt 
 200610-16 2757
chrMT 6752 6753 200610-10
 200610-100 15173

スタイルの行末と必要な出力のperl両方を処理するには、次のようにします。dos

$ perl -lane 'print "chr$F[0]\t", $F[3]-1, "\t$F[3]\t$F[1]"' ip.txt 
chrMT   2756    2757    200610-1
chrMT   6752    6753    200610-10
chrMT   15172   15173   200610-100

では、まずawk行末をスタイルに変更し、可能な場合はで変更するか、unixdos2unixperl

$ perl -i -pe 's|\r\n|\n|' ip.txt 
$ cat -e ip.txt 
    MT      200610-1        100     2757$
    MT      200610-10       100     6753 $
    MT      200610-100      100     15173$

その後

$ awk -v OFS='\t' '{print "chr"$1,$4-1,$4,$2}' ip.txt 
chrMT   2756    2757    200610-1
chrMT   6752    6753    200610-10
chrMT   15172   15173   200610-100

または、を使ってGNU awk、入力レコードをDOS形式の行末処理するように設定する

gawk -v RS='\r\n' -v OFS='\t' '{print "chr"$1,$4-1,$4,$2}' ip.txt

Question 2

ステートメント内のすべてをprint希望の形式で入力し、減算などの必要な操作$NF - 1も実行します。

awk '{print "chr" $1, ($NF - 1), $NF, $2}' file.txt

$4ここではの代わりにを使用することもできます$NFが、4 番目のフィールドが最後のフィールドであるため、両方とも同じフィールドを指すことになります。

例：

% awk '{print "chr" $1, ($NF - 1), $NF, $2}' file.txt 
chrMT 2756 2757 200610-1
chrMT 6752 6753 200610-10
chrMT 15172 15173 200610-100

Answer

ステートメント内のすべてをprint希望の形式で入力し、減算などの必要な操作$NF - 1も実行します。

awk '{print "chr" $1, ($NF - 1), $NF, $2}' file.txt

$4ここではの代わりにを使用することもできます$NFが、4 番目のフィールドが最後のフィールドであるため、両方とも同じフィールドを指すことになります。

例：

% awk '{print "chr" $1, ($NF - 1), $NF, $2}' file.txt 
chrMT 2756 2757 200610-1
chrMT 6752 6753 200610-10
chrMT 15172 15173 200610-100

awk を使用して新しいファイルを作成すると、特定の 1 つの列を使用するときに問題が発生しますが、何が間違っているのかわかりません。

答え1

答え2

関連情報