Was macht dieser grep- und sed-Befehl?

Question

Die Art und Weise, wie der sed-Befehl jetzt geschrieben ist, ist falsch. Es sollte entweder ein Skript wie dieses sein:

1i{
s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/
$a}

oder in einer einzelnen Zeile wie dieser:

sed -e '1i{' -e 's/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/' -e '$a}'

Buchstäblich alles, was Sie nach Befehlen iund abis zu einem Zeilenumbruch oder Ende eines Ausdrucks (mit -e) einfügen, wird direkt auf der Standardausgabe gedruckt.

Was es bewirkt, wollen wir im Folgenden aufschlüsseln:

1i{

1ist eine Zeilenadresse. Sie teilt sed mit, wann ein Befehl ausgeführt werden soll. Wenn der Inhalt der ersten Zeile in den Musterbereich eingelesen wird (ohne den abschließenden Zeilenumbruch), ifügt es in der Standardausgabe in einer separaten Zeile '{' ein. Beachten Sie, dass der Musterbereich unverändert bleibt, das '{' wurde ihm nicht hinzugefügt.

sist der Such- und Ersetzungsbefehl, der vielseitigste Befehl in sed. \sentspricht einem Leerzeichen. $regex$gruppiert den regulären Ausdruck darin wie in der Mathematik, speichert aber auch, was damit übereinstimmt, in einem numerischen Register basierend auf der Reihenfolge dieser Gruppe: \1 bis \9.

Die Ausgabe uniq -csieht ungefähr so aus:

    occurrences string
    3 user

Jetzt der komplizierte Teil:

\s*\([0-9]*\)\s*\(.*\)

Immer noch in Zeile 1. Der Musterraum besteht aus einer Reihe von Leerzeichen, dann „3 Benutzer“. Um dies zu finden, suchen wir null oder mehrmals nach Leerzeichen, dann viele Male nach einer Ziffer, also einer Zahl (meiner Meinung nach hätte es + statt * sein sollen), die im Register \1 gespeichert ist, dann nach einem Leerzeichen (* ist meiner Meinung nach nicht erforderlich), dann viele Male nach einem beliebigen Zeichen (auch hier wäre + besser gewesen), das im Register \2 gespeichert ist. Das Vorkommen befindet sich jetzt also in \1 und String/Benutzer in \2.

"\2": \1,

Die ganze Zeile wurde abgeglichen und Teile wurden gespeichert. Jetzt ersetzen wir das, was abgeglichen wurde, durch ein Anführungszeichen, dann durch den Benutzer, dann durch ein Anführungszeichen, einen Doppelpunkt, ein Leerzeichen, ein Vorkommen und ein Komma.

$a}

$ist ebenfalls eine Zeilenadresse. Wenn die aktuelle Zeile die letzte ist (im Moment nicht), rufen Sie den aBefehl auf, um '}' in einer separaten Zeile an die Standardausgabe anzuhängen.

Dies ist das Ende der Codeverarbeitung für diese Zeile, der Musterbereich wird automatisch so gedruckt, wie er nach Abschluss der Manipulation ist, dann wird der Inhalt der zweiten Zeile gelesen und der gesamte Zyklus wiederholt.

Beispielausgabe:

{
"user": 3,
}

Dies ist grundsätzlich ein JSON-Dateiformat, allerdings mit falscher Einrückung.

Das ist es. Entschuldigen Sie, dass ich Romane schreibe :)

Answer 1

Die Art und Weise, wie der sed-Befehl jetzt geschrieben ist, ist falsch. Es sollte entweder ein Skript wie dieses sein:

1i{
s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/
$a}

oder in einer einzelnen Zeile wie dieser:

sed -e '1i{' -e 's/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/' -e '$a}'

Buchstäblich alles, was Sie nach Befehlen iund abis zu einem Zeilenumbruch oder Ende eines Ausdrucks (mit -e) einfügen, wird direkt auf der Standardausgabe gedruckt.

Was es bewirkt, wollen wir im Folgenden aufschlüsseln:

1i{

1ist eine Zeilenadresse. Sie teilt sed mit, wann ein Befehl ausgeführt werden soll. Wenn der Inhalt der ersten Zeile in den Musterbereich eingelesen wird (ohne den abschließenden Zeilenumbruch), ifügt es in der Standardausgabe in einer separaten Zeile '{' ein. Beachten Sie, dass der Musterbereich unverändert bleibt, das '{' wurde ihm nicht hinzugefügt.

sist der Such- und Ersetzungsbefehl, der vielseitigste Befehl in sed. \sentspricht einem Leerzeichen. $regex$gruppiert den regulären Ausdruck darin wie in der Mathematik, speichert aber auch, was damit übereinstimmt, in einem numerischen Register basierend auf der Reihenfolge dieser Gruppe: \1 bis \9.

Die Ausgabe uniq -csieht ungefähr so aus:

    occurrences string
    3 user

Jetzt der komplizierte Teil:

\s*\([0-9]*\)\s*\(.*\)

Immer noch in Zeile 1. Der Musterraum besteht aus einer Reihe von Leerzeichen, dann „3 Benutzer“. Um dies zu finden, suchen wir null oder mehrmals nach Leerzeichen, dann viele Male nach einer Ziffer, also einer Zahl (meiner Meinung nach hätte es + statt * sein sollen), die im Register \1 gespeichert ist, dann nach einem Leerzeichen (* ist meiner Meinung nach nicht erforderlich), dann viele Male nach einem beliebigen Zeichen (auch hier wäre + besser gewesen), das im Register \2 gespeichert ist. Das Vorkommen befindet sich jetzt also in \1 und String/Benutzer in \2.

"\2": \1,

Die ganze Zeile wurde abgeglichen und Teile wurden gespeichert. Jetzt ersetzen wir das, was abgeglichen wurde, durch ein Anführungszeichen, dann durch den Benutzer, dann durch ein Anführungszeichen, einen Doppelpunkt, ein Leerzeichen, ein Vorkommen und ein Komma.

$a}

$ist ebenfalls eine Zeilenadresse. Wenn die aktuelle Zeile die letzte ist (im Moment nicht), rufen Sie den aBefehl auf, um '}' in einer separaten Zeile an die Standardausgabe anzuhängen.

Dies ist das Ende der Codeverarbeitung für diese Zeile, der Musterbereich wird automatisch so gedruckt, wie er nach Abschluss der Manipulation ist, dann wird der Inhalt der zweiten Zeile gelesen und der gesamte Zyklus wiederholt.

Beispielausgabe:

{
"user": 3,
}

Dies ist grundsätzlich ein JSON-Dateiformat, allerdings mit falscher Einrückung.

Das ist es. Entschuldigen Sie, dass ich Romane schreibe :)

Was macht dieser grep- und sed-Befehl?

Antwort1

verwandte Informationen