gawk - Dynamische Erstellung einer Textdatei unter Verwendung von Eingabedateifeldern

gawk - Dynamische Erstellung einer Textdatei unter Verwendung von Eingabedateifeldern

Ich habe eine Textdatei, die so aussieht:

UICEX_0001  UICEX_0001_T1.bam   UICEX_0001_C2.bam   chr1:16946335   chr19:9064309   chr8:10480278                                                                               
UICEX_0003  UICEX_0003_T1.bam   UICEX_0003_C2.bam   chr1:16974893

Ich versuche, diese Informationen zu verwenden, um etwas wie das Folgende zu erstellen, indem ich Zeichenfolgen kombiniere und Informationen dynamisch aus der Textdatei einfüge. Ich möchte:

  • durch jede Zeile schleifen
  • Weisen Sie den ersten drei Spalten Variablen zu
  • Drucken Sie einen Text mit diesen Variablen
  • dann durch die vierte Spalte schleifen
  • etwas Bestimmtes drucken.

Hier ist ein Beispiel meiner Ausgabedatei:

Ausgabedatei

load UICEX_0001_T1.bam
load UICEX_0001_C2.bam
goto chr1:16946335
collapse
snapshot UICEX_0001_chr1:16946335.png
goto chr19:9064309
collapse
snapshot UICEX_0001_chr19:9064309.png
goto chr8:10480278
collapse
snapshot UICEX_0001_chr8:10480278.png

load UICEX_0003_T1.bam
load UICEX_0003_C2.bam
collapse
snapshot UICEX_0003_chr1:16974893.png

Was ich versucht habe

Ich dachte, ich könnte dies erreichen, indem ich Gawk-Befehle verschachtele. Hier ist einer, den ich ausprobiert habe:

SAMPLEFILE = "2016-10-13_mutation_table.txt"
gawk -F";" 'BEGIN{
gawk -F";" -v SAMPLE=$(cat $SAMPLEFILE | cut -d"\t" -f1) -v BAMT=$(cat $SAMPLEFILE | cut -d"\t" -f2) -v BAMN=$(cat $SAMPLEFILE | cut -d"\t" -f3);}{print "new \nload " $BAMN;}
{print "new \nload " $BAMT;}
{awk "{for(i=4; i<=NF-1; i++){ print "goto " $i ; print "collapse\nsnapshot " $SAMPLE"_"$i".png";} }" 2016-10-13_mutation_table.txt;

}END{print "exit \n"}'

Bei der Ausführung treten jedoch Fehler wie dieser auf:

gawk: cmd. line:2: gawk -F";" -v SAMPLE=$(cat $SAMPLEFILE | cut -d"\t" -f1) ...
gawk: cmd. line:2:                     ^ syntax error

Antwort1

try this

$ awk '{printf("load %s\nload %s\n",$2,$3);for(i=4;i<=NF;i++){printf("goto %s\ncollapse\nsnapshot %s_%s.png\n",$i,$1,$i)}}' test.t
    load UICEX_0001_T1.bam
    load UICEX_0001_C2.bam
    goto chr1:16946335
    collapse
    snapshot UICEX_0001_chr1:16946335.png
    goto chr19:9064309
    collapse
    snapshot UICEX_0001_chr19:9064309.png
    goto chr8:10480278
    collapse
    snapshot UICEX_0001_chr8:10480278.png
    load UICEX_0003_T1.bam
    load UICEX_0003_C2.bam
    goto chr1:16974893
    collapse
    snapshot UICEX_0003_chr1:16974893.png

Antwort2

Was duerscheinenzu verlangen, kann getan werden als

awk '
  NR > 1 {print ""}
  {
    printf("load %s\nload %s\n", $2, $3);
    for (i=4; i<=NF; i++) {
      if (NF > 4) printf("goto %s\n", $i);
      printf("collapse\nsnapshot %s_%s.png\n", $1, $i);
    }
  }
' samplefile

verwandte Informationen