Wie kann ich Daten basierend auf bestimmten Flags für Datenzeilen abrufen und mit ihnen eine neue Datei erstellen?

Question 1

Verwendung von Raku (früher bekannt als Perl6)

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

Der .grepobige Code basiert auf Rakus .wordsFunktion, die bei Leerzeichen trennt. Es ist Code enthalten, um Zeilen zu erfassen, die mit " **" beginnen. Die .trim-leadingMethode entfernt führende Leerzeichen aus der Ausgabe.

Sie können sehen, dass diese Lösung in zwei Schritten abläuft. Um die Sternchen am Anfang und Ende zu entfernen, führen Sie den obigen Code aus, speichern Sie ihn in einer Datei tmp_file.txtund führen Sie dann den folgenden Code aus:

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

HTH.

https://raku.org

Answer

Verwendung von Raku (früher bekannt als Perl6)

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

Der .grepobige Code basiert auf Rakus .wordsFunktion, die bei Leerzeichen trennt. Es ist Code enthalten, um Zeilen zu erfassen, die mit " **" beginnen. Die .trim-leadingMethode entfernt führende Leerzeichen aus der Ausgabe.

Sie können sehen, dass diese Lösung in zwei Schritten abläuft. Um die Sternchen am Anfang und Ende zu entfernen, führen Sie den obigen Code aus, speichern Sie ihn in einer Datei tmp_file.txtund führen Sie dann den folgenden Code aus:

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

HTH.

https://raku.org

Question 2

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

Dadurch werden die Eingabezeilen gedruckt, wobei entweder:

$1 ist einer der zulässigen Werte (254, 1, 3 oder 9)
1 $ ist 4Und2 $ sind entweder 1000, 925 oder 850.

Alle anderen Zeilen werden ignoriert.

HINWEIS: Dies entspricht nicht genau Ihrer Beispielausgabe, da a) Ihre Beispielausgabe nicht mit der Beschreibung dessen übereinstimmt, was Sie möchten (*) und b) in Ihrem Kommentar stand, dass Sie keine Zeilen möchten, die mit 2 beginnen.

(*) Zumindest, soweit ich es verstehe. Ihre Beschreibung ist sehr unklar und schwer zu analysieren... ich habe mehrere Minuten gebraucht, um sie zu entziffern, und ich bin mir immer noch nicht sicher, ob sie richtig ist. Entweder ist das, was Sie wollen, viel komplizierter als es scheint, oder Sie haben es auf eine bizarr komplizierte Weise geschrieben.

Answer

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

Dadurch werden die Eingabezeilen gedruckt, wobei entweder:

$1 ist einer der zulässigen Werte (254, 1, 3 oder 9)
1 $ ist 4Und2 $ sind entweder 1000, 925 oder 850.

Alle anderen Zeilen werden ignoriert.

HINWEIS: Dies entspricht nicht genau Ihrer Beispielausgabe, da a) Ihre Beispielausgabe nicht mit der Beschreibung dessen übereinstimmt, was Sie möchten (*) und b) in Ihrem Kommentar stand, dass Sie keine Zeilen möchten, die mit 2 beginnen.

(*) Zumindest, soweit ich es verstehe. Ihre Beschreibung ist sehr unklar und schwer zu analysieren... ich habe mehrere Minuten gebraucht, um sie zu entziffern, und ich bin mir immer noch nicht sicher, ob sie richtig ist. Entweder ist das, was Sie wollen, viel komplizierter als es scheint, oder Sie haben es auf eine bizarr komplizierte Weise geschrieben.

Wie kann ich Daten basierend auf bestimmten Flags für Datenzeilen abrufen und mit ihnen eine neue Datei erstellen?

Antwort1

Antwort2

verwandte Informationen