GREP caracteres en mayúscula de una columna específica, canaliza el resultado al mismo archivo que la nueva columna

Question 1

¿Existe alguna opción o parámetro en grep para especificar una columna?

grepno tieneseparador de campoopción.
Utilice lo siguienteawkacercarse en su lugar:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- captura letras mayúsculas dentro del campo 19

$20=substr($19,RSTART,RLENGTH) FS $20- extrae letras mayúsculas coincidentes de19º campo y lo inserta como20º valor del campo

Answer

¿Existe alguna opción o parámetro en grep para especificar una columna?

grepno tieneseparador de campoopción.
Utilice lo siguienteawkacercarse en su lugar:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- captura letras mayúsculas dentro del campo 19

$20=substr($19,RSTART,RLENGTH) FS $20- extrae letras mayúsculas coincidentes de19º campo y lo inserta como20º valor del campo

Question 2

Para responder a tu pregunta literal sobre cómo hacerlo congrep solo. Aunque grepno ha sido diseñado para eso, con GNU grepy construido con soporte PCRE, podrías hacer:

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

Es decir, busque 18 secuencias <not-TABs><tab>al principio de la línea o al final de la coincidencia anterior ( \G) seguidas del menor número posible de caracteres que no sean tabulaciones (por lo que todavía estamos en el campo 19) seguido de una mayúscula. caracter, pero con \Kreseteamos el inicio delemparejadoparte justo antes de ese carácter en mayúscula.

Entonces en una entrada como:

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

Informaría:

A
C

Como con tu cut | grepenfoque.

Si solo está interesado en el primer carácter mayúsculo del campo 19, puede simplificarlo a:

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

Para insertarlo como el día 20.columna, Podrías hacerlo:

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

O para insertarlo como última columna:

grep... < file | paste file - > newfile

Answer

Para responder a tu pregunta literal sobre cómo hacerlo congrep solo. Aunque grepno ha sido diseñado para eso, con GNU grepy construido con soporte PCRE, podrías hacer:

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

Es decir, busque 18 secuencias <not-TABs><tab>al principio de la línea o al final de la coincidencia anterior ( \G) seguidas del menor número posible de caracteres que no sean tabulaciones (por lo que todavía estamos en el campo 19) seguido de una mayúscula. caracter, pero con \Kreseteamos el inicio delemparejadoparte justo antes de ese carácter en mayúscula.

Entonces en una entrada como:

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

Informaría:

A
C

Como con tu cut | grepenfoque.

Si solo está interesado en el primer carácter mayúsculo del campo 19, puede simplificarlo a:

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

Para insertarlo como el día 20.columna, Podrías hacerlo:

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

O para insertarlo como última columna:

grep... < file | paste file - > newfile

Question 3

Con sedtu puedes hacer

sed '/^#/!s/\([^ ]* *\)\{18\}[a-z]*\([A-Z]\).*/&  \2/'

Esto es, para todas las líneas que no comienzan con #(el /^#/!selector), después de 18 combinaciones de espacios y no espacios, marque la letra mayúscula con para luego referirse a ella, "reemplace" toda la línea por sí misma y agregue espacios con la mayúscula encontrada. carta.

Si prefiere expresiones regulares extendidas, también puede usar

sed -E '/^#/!s/([^ ]* *){18}[a-z]*([A-Z]).*/&  \2/'

Si las columnas están separadas por una tabulación en lugar de espacios, vaya

sed -E '/^#/!s/([^\t]*\t){18}[a-z]*([A-Z]).*/&\t\2/'

Answer

Con sedtu puedes hacer

sed '/^#/!s/\([^ ]* *\)\{18\}[a-z]*\([A-Z]\).*/&  \2/'

Esto es, para todas las líneas que no comienzan con #(el /^#/!selector), después de 18 combinaciones de espacios y no espacios, marque la letra mayúscula con para luego referirse a ella, "reemplace" toda la línea por sí misma y agregue espacios con la mayúscula encontrada. carta.

Si prefiere expresiones regulares extendidas, también puede usar

sed -E '/^#/!s/([^ ]* *){18}[a-z]*([A-Z]).*/&  \2/'

Si las columnas están separadas por una tabulación en lugar de espacios, vaya

sed -E '/^#/!s/([^\t]*\t){18}[a-z]*([A-Z]).*/&\t\2/'

GREP caracteres en mayúscula de una columna específica, canaliza el resultado al mismo archivo que la nueva columna

Respuesta1

Respuesta2

Respuesta3

información relacionada