Substituindo os IDs seq do arquivo fasta com base nos novos IDs de uma lista

Question 1

Usando awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

Primeiro, leia o arquivo de texto que contém o mapeamento e salve o segundo campo no array ausando o primeiro campo como índice. Pule para o nextregistro.

Em seguida, leia o arquivo fasta. Se o registro começar com >, procure o novo id do array removendo o primeiro caractere do registro atual ( substr($0, 2)) e usando este valor como índice do array.
Se o id não estiver vazio, imprima >o id e pule para o nextregistro.

Imprime 1o registro atual (as sequências ou ids não correspondentes).

Answer

Usando awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

Primeiro, leia o arquivo de texto que contém o mapeamento e salve o segundo campo no array ausando o primeiro campo como índice. Pule para o nextregistro.

Em seguida, leia o arquivo fasta. Se o registro começar com >, procure o novo id do array removendo o primeiro caractere do registro atual ( substr($0, 2)) e usando este valor como índice do array.
Se o id não estiver vazio, imprima >o id e pule para o nextregistro.

Imprime 1o registro atual (as sequências ou ids não correspondentes).

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Substituindo os IDs seq do arquivo fasta com base nos novos IDs de uma lista

Responder1

Responder2

informação relacionada