GREP-Großbuchstaben aus einer bestimmten Spalte, leitet das Ergebnis in dieselbe Datei wie die neue Spalte weiter

Question 1

gibt es in grep eine Option oder einen Parameter, um eine Spalte anzugeben?

grephat nichtFeldtrennzeichenOption.
Verwenden Sie die folgendenawkAnsatz stattdessen:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- erfasst Großbuchstaben im 19. Feld

$20=substr($19,RSTART,RLENGTH) FS $20- extrahiert übereinstimmende Großbuchstaben aus19te Feld und fügt es ein als20ter Feldwert

Answer

gibt es in grep eine Option oder einen Parameter, um eine Spalte anzugeben?

grephat nichtFeldtrennzeichenOption.
Verwenden Sie die folgendenawkAnsatz stattdessen:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- erfasst Großbuchstaben im 19. Feld

$20=substr($19,RSTART,RLENGTH) FS $20- extrahiert übereinstimmende Großbuchstaben aus19te Feld und fügt es ein als20ter Feldwert

Question 2

Um Ihre wörtliche Frage zu beantworten, wie man das macht mitgrep allein. Obwohl grepes nicht dafür entwickelt wurde, grepkönnen Sie mit GNU und PCRE-Unterstützung Folgendes tun:

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

Das heißt, wir suchen entweder nach 18 Sequenzen von <not-TABs><tab>am Anfang der Zeile oder am Ende der vorherigen Übereinstimmung ( \G), gefolgt von der kleinstmöglichen Anzahl von Nicht-Tabulatorzeichen (so dass wir uns immer noch im 19. Feld befinden), gefolgt von einem Großbuchstaben, aber mit \Ksetzen wir den Anfang derabgestimmtTeil direkt vor diesem Großbuchstaben.

Bei einer Eingabe wie:

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

Es würde berichtet:

A
C

Wie bei Ihrem cut | grepAnsatz.

Wenn Sie nur am ersten Großbuchstaben im 19. Feld interessiert sind, können Sie es wie folgt vereinfachen:

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

Um es als 20. einzufügenSpalte, du könntest es tun:

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

Oder um es als letzte Spalte einzufügen:

grep... < file | paste file - > newfile

Answer

Um Ihre wörtliche Frage zu beantworten, wie man das macht mitgrep allein. Obwohl grepes nicht dafür entwickelt wurde, grepkönnen Sie mit GNU und PCRE-Unterstützung Folgendes tun:

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

Das heißt, wir suchen entweder nach 18 Sequenzen von <not-TABs><tab>am Anfang der Zeile oder am Ende der vorherigen Übereinstimmung ( \G), gefolgt von der kleinstmöglichen Anzahl von Nicht-Tabulatorzeichen (so dass wir uns immer noch im 19. Feld befinden), gefolgt von einem Großbuchstaben, aber mit \Ksetzen wir den Anfang derabgestimmtTeil direkt vor diesem Großbuchstaben.

Bei einer Eingabe wie:

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

Es würde berichtet:

A
C

Wie bei Ihrem cut | grepAnsatz.

Wenn Sie nur am ersten Großbuchstaben im 19. Feld interessiert sind, können Sie es wie folgt vereinfachen:

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

Um es als 20. einzufügenSpalte, du könntest es tun:

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

Oder um es als letzte Spalte einzufügen:

grep... < file | paste file - > newfile

Question 3

Mit sedIhnen können Sie

sed '/^#/!s/\([^ ]* *\)\{18\}[a-z]*\([A-Z]\).*/&  \2/'

#Das heißt, für alle Zeilen, die nicht mit (dem Selektor) beginnen /^#/!, markieren Sie nach 18 Kombinationen aus Nicht-Leerzeichen und Leerzeichen den Großbuchstaben mit, um später darauf verweisen zu können, „ersetzen“ Sie die gesamte Zeile durch sich selbst und hängen Sie Leerzeichen mit dem gefundenen Großbuchstaben an.

Wenn Sie erweiterte reguläre Ausdrücke bevorzugen, können Sie auch

sed -E '/^#/!s/([^ ]* *){18}[a-z]*([A-Z]).*/&  \2/'

Wenn Spalten durch Tabulatoren statt Leerzeichen getrennt sind,

sed -E '/^#/!s/([^\t]*\t){18}[a-z]*([A-Z]).*/&\t\2/'

Answer

Mit sedIhnen können Sie

sed '/^#/!s/\([^ ]* *\)\{18\}[a-z]*\([A-Z]\).*/&  \2/'

#Das heißt, für alle Zeilen, die nicht mit (dem Selektor) beginnen /^#/!, markieren Sie nach 18 Kombinationen aus Nicht-Leerzeichen und Leerzeichen den Großbuchstaben mit, um später darauf verweisen zu können, „ersetzen“ Sie die gesamte Zeile durch sich selbst und hängen Sie Leerzeichen mit dem gefundenen Großbuchstaben an.

Wenn Sie erweiterte reguläre Ausdrücke bevorzugen, können Sie auch

sed -E '/^#/!s/([^ ]* *){18}[a-z]*([A-Z]).*/&  \2/'

Wenn Spalten durch Tabulatoren statt Leerzeichen getrennt sind,

sed -E '/^#/!s/([^\t]*\t){18}[a-z]*([A-Z]).*/&\t\2/'

GREP-Großbuchstaben aus einer bestimmten Spalte, leitet das Ergebnis in dieselbe Datei wie die neue Spalte weiter

Antwort1

Antwort2

Antwort3

verwandte Informationen