Reemplazo de los ID de secuencia del archivo fasta según los nuevos ID de una lista

Question 1

Usando awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

Primero, lea el archivo de texto que contiene la asignación y guarde el segundo campo en una matriz ausando el primer campo como índice. Saltar al nextregistro.

Luego lea el archivo fasta. Si el registro comienza con >, busque la nueva identificación de la matriz eliminando el primer carácter del registro actual ( substr($0, 2)) y usando este valor como índice de la matriz.
Si la identificación no está vacía, imprima >la identificación y salte al nextregistro.

Imprime 1el registro actual (las secuencias o identificadores que no coinciden).

Answer

Usando awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

Primero, lea el archivo de texto que contiene la asignación y guarde el segundo campo en una matriz ausando el primer campo como índice. Saltar al nextregistro.

Luego lea el archivo fasta. Si el registro comienza con >, busque la nueva identificación de la matriz eliminando el primer carácter del registro actual ( substr($0, 2)) y usando este valor como índice de la matriz.
Si la identificación no está vacía, imprima >la identificación y salte al nextregistro.

Imprime 1el registro actual (las secuencias o identificadores que no coinciden).

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Reemplazo de los ID de secuencia del archivo fasta según los nuevos ID de una lista

Respuesta1

Respuesta2

información relacionada