awk para extraer un patrón específico en un archivo basado en una coincidencia de variables

awk para extraer un patrón específico en un archivo basado en una coincidencia de variables

A awkcontinuación, intento extraer el valor de RSTRINGen función de dónde $VCFse encuentra el valor de otra variable en un archivo file. El valor de $VCFya está extraído y RSTRINGactualmente todas las líneas comienzan con R_2019. Lo que estoy tratando de lograr es RSTRINGconfigurarlo según dónde $VCFse encontró. Gracias :).

archivo

xxx_0000 19-0004-La-Fi
xxx_0001 19-0005-Last-Firs
xxx_0003 19-0008-LastN-FirstN
xxx_0005 190320-Control
R_2019_00_00_xxxx-000-v5.6_xxxxx

xxx_0007 19-0000-LastName-FirstName
xxx_0009 19-0001-Las-Fir
xxx_0011 190319-Control
R_2019_00_00_xxxx-00-v5.6_xxxxx

Si$VCF=19-0008-LastN-FirstN

deseado

RSTRING=R_2019_00_00_xxxx-000-v5.6_xxxxx

Si$VCF=19-0008-Las-Fir

deseado

RSTRING=R_2019_00_00_xxxx-00-v5.6_xxxxx

awk

awk -v ref="$VCF" 'match($0, ref) {print "$RSTRING"}' file

Respuesta1

Dos opciones:

  1. leyendo el archivo línea por línea, establezca un indicador booleano cuando encuentre el VCF y luego imprima elpróximoRSTRING:

    awk -v ref="$VCF" '
        $0 ~ ref {have_vcf = 1}
        have_vcf && /^R_2019/ {print; have_vcf = 0}
    ' file
    
  2. Lea el archivo por párrafos. Si el registro actual contiene el VCF, imprima el último campo del registro:

    awk -F '\n' -v RS="" -v ref="$VCF" '$0 ~ ref {print $NF}' file
    

información relacionada