Wie lassen sich Zeichenfolgen in zwei Dateien abgleichen und ersetzen?

Question

Das Problem mit Ihrem Skript bestand darin, dass Sie versuchten, Zeichenfolgen wie 11:775852:T:Cals Schlüssel in einer Karte zu verwenden, deren Schlüssel das Format haben 775852.

Ich habe die erste Spalte aus dieser Verarbeitung weggelassen, da Sie in einem Kommentar erwähnt haben, dass Sie sie nicht für erforderlich halten.

NR==FNR { map[$2]=$5 }
NR!=FNR { split($2, x, ":"); if(x[2] in map){ $2=map[x[2]]; print }}

Früher habe ich splitden relevanten Teil der Zeichenfolge abgerufen und eine Bedingung hinzugefügt, da es bis zur Verarbeitung dieser Teilzeichenfolge keine Möglichkeit gibt, die erforderliche Suche durchzuführen.

Dies scheint wie gewünscht zu funktionieren:

[gnubeard@mothership: ~/dna]$ awk -f test.awk FS=',' marker-info FS=' ' output11.frq
 1  rs2980300 T C 0.1707 3444
 1  rs4245756 T C 0.07923 3496

Stellen Sie sicher, dass die vorhandenen Felder mit den Spalten übereinstimmen, die Sie vermuten. Wenn Sie möchten, dass die Ausgabe tabulatorgetrennt ist, können Sie die OFSVariable in der zweiten Hälfte des Skripts wie folgt festlegen:NR!=FNR { OFS="\t"; split($2, x, ":"); if(x[2] in map){ $2=map[x[2]]; print }}

BEARBEITEN: Ich habe die FSVariable im Befehl geändert, um das Trennzeichen für output11.frq in ein Leerzeichen zu ändern. Dadurch wird Fummelei mit der Anzahl der Tabulatoren vermieden.

Answer 1