Extrahieren Sie zwei Felder zeilenweise mit mehreren Trennzeichen

Extrahieren Sie zwei Felder zeilenweise mit mehreren Trennzeichen

Ich habe eine Datei wie diese

field01 field02 field03 field04 definition: field05; measure: field06; weight: field07;
field11 field12 field13 field14 definition: field15; measure: field16; 
field21 field22 field33 definition: field25; weight: field27;
field31 field32 field03 field34 definition: field35; measure: field36; wight: field47;

Die gewünschte Ausgabe ist das zweite Feld und das Feld nach ‚Definition:

field02 field05
field12 field15
field22 field25
field32 field35

Das Trennzeichen enthält ' ','definition:' und ';'

das meiste was ich getan habe ist

awk -F'definition:' '{print $2}' file |awk 'split($1, a, ");") {print substr(a[1],-5)}'

Es gibt mir:

field05;
field15;
field25;
field35;

Aber das ist nicht das, was ich will. field05, field15 und field35 können unterschiedliche Längen haben

Antwort1

Probieren Sie dieses awk aus:

awk '
{  
    split($0,temp,"definition: ") #Get everything after "definition: " in temp[2]
    split(temp[2],final,";")      #Get everything between "definition :" and ";" in final[1]
    print $2,final[1]
}' 

Einzeiler, wie gewünscht:

awk '{split($0,t,"definition: ");split(t[2],f,";");print $2,f[1]}'

Antwort2

Eine Art Hack-Vorschlag:

awk -F'[:;]' '{ print $2,$1 }' file | awk -F' ' '{ print $2, $1 }'

Ausgabe

field01 field05
field11 field15
field21 field25
field31 field35

Antwort3

Zu spät zur Show, aber eine andere awkLösung, nur zum Spaß

awk -F'[ ;]' '{f=3; while ($f!~"defin") f++; print $2, $(f+1)}' file1

Antwort4

Habe es mit dem Below-Befehl versucht und es hat gut funktioniert

awk '{for (i=1;i<=NF;i++){if($i ~ /definition:/){gsub(";","",$(i+1));print $2,$(i+1)}}}' filename

Ausgabe

field02 field05
field12 field15
field22 field25
field32 field35

verwandte Informationen