根據清單中的新 ID 取代 fasta 檔案的 seq ID

Question 1

使用awk：

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

首先，讀取包含映射的文字文件，並a使用第一個欄位作為索引將第二個欄位保存在陣列中。跳到next記錄。

然後讀取fasta檔案。如果記錄以開頭，則透過從目前記錄 ( ) 中刪除第一個字元並使用該值作為陣列索引來>從陣列中尋找新的 id 。如果 id 不為空，則列印id 並跳到該記錄。substr($0, 2)
>next

列印1目前記錄（序列或不符的 ID）。

Answer

使用awk：

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

首先，讀取包含映射的文字文件，並a使用第一個欄位作為索引將第二個欄位保存在陣列中。跳到next記錄。

然後讀取fasta檔案。如果記錄以開頭，則透過從目前記錄 ( ) 中刪除第一個字元並使用該值作為陣列索引來>從陣列中尋找新的 id 。如果 id 不為空，則列印id 並跳到該記錄。substr($0, 2)
>next

列印1目前記錄（序列或不符的 ID）。

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

相關內容