как я могу извлечь данные на основе определенных флагов для строк данных и создать с ними новый файл

Question 1

Использование Raku (ранее известного как Perl6)

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

Код .grepвыше основан на функции Raku .words, которая разделяет по пробелам. Код включен для захвата строк, начинающихся с " **". .trim-leadingМетод удаляет начальные пробелы из вывода.

Вы можете увидеть, что это решение выполняется в два этапа. Чтобы обрезать начальные и конечные звездочки, запустите код выше, сохраните в tmp_file.txt, а затем запустите код ниже:

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

НТН.

https://raku.org

Answer

Использование Raku (ранее известного как Perl6)

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

Код .grepвыше основан на функции Raku .words, которая разделяет по пробелам. Код включен для захвата строк, начинающихся с " **". .trim-leadingМетод удаляет начальные пробелы из вывода.

Вы можете увидеть, что это решение выполняется в два этапа. Чтобы обрезать начальные и конечные звездочки, запустите код выше, сохраните в tmp_file.txt, а затем запустите код ниже:

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

НТН.

https://raku.org

Question 2

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

Это выведет на экран входные строки, где:

$1 — одно из допустимых значений (254, 1, 3 или 9)
1 доллар равен 4и2 доллара — это 1000, 925 или 850.

Все остальные строки игнорируются.

ПРИМЕЧАНИЕ: Это не совсем соответствует вашему примеру вывода, потому что а) ваш пример вывода не соответствует описанию того, что вы хотите (*) и б) в вашем комментарии указано, что вам не нужны строки, начинающиеся с 2.

(*) По крайней мере, насколько я могу понять. Ваше описание очень неясное и трудно поддается анализу... мне потребовалось несколько минут, чтобы его расшифровать, и я все еще не уверен, что оно верно. Либо то, что вы хотите, гораздо сложнее, чем кажется, либо вы написали это в странной сложной манере.

Answer

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

Это выведет на экран входные строки, где:

$1 — одно из допустимых значений (254, 1, 3 или 9)
1 доллар равен 4и2 доллара — это 1000, 925 или 850.

Все остальные строки игнорируются.

ПРИМЕЧАНИЕ: Это не совсем соответствует вашему примеру вывода, потому что а) ваш пример вывода не соответствует описанию того, что вы хотите (*) и б) в вашем комментарии указано, что вам не нужны строки, начинающиеся с 2.

(*) По крайней мере, насколько я могу понять. Ваше описание очень неясное и трудно поддается анализу... мне потребовалось несколько минут, чтобы его расшифровать, и я все еще не уверен, что оно верно. Либо то, что вы хотите, гораздо сложнее, чем кажется, либо вы написали это в странной сложной манере.

как я могу извлечь данные на основе определенных флагов для строк данных и создать с ними новый файл

решение1

решение2

Связанный контент