リストの新しいIDに基づいてFastaファイルのシーケンスIDを置き換える

Question 1

使用方法awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

まず、マッピングを含むテキストファイルを読み取り、a最初のフィールドをインデックスとして使用して、配列の 2 番目のフィールドを保存します。nextレコードにスキップします。

次に fasta ファイルを読み取ります。レコードがで始まる場合は、現在のレコード ( )>から最初の文字を削除し、この値を配列インデックスとして使用して、配列から新しい ID を検索します。ID が空でない場合は、ID を出力し、レコードにスキップします。substr($0, 2)
>next

1現在のレコード (シーケンスまたは一致しない ID) を出力します。

Answer

使用方法awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

まず、マッピングを含むテキストファイルを読み取り、a最初のフィールドをインデックスとして使用して、配列の 2 番目のフィールドを保存します。nextレコードにスキップします。

次に fasta ファイルを読み取ります。レコードがで始まる場合は、現在のレコード ( )>から最初の文字を削除し、この値を配列インデックスとして使用して、配列から新しい ID を検索します。ID が空でない場合は、ID を出力し、レコードにスキップします。substr($0, 2)
>next

1現在のレコード (シーケンスまたは一致しない ID) を出力します。

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

リストの新しいIDに基づいてFastaファイルのシーケンスIDを置き換える

答え1

答え2

関連情報