Datei basierend auf Muster in mehrere Dateien aufteilen

Question 1

Verwenden voncsplit

csplit -z somefile /ABC/ '{*}'

Die Ausgabedateien sind standardmäßig xx00, , ..., Sie können das Format und die Nummerierung jedoch bei Bedarf ändern - siehexx01man csplit

Answer

Verwenden voncsplit

csplit -z somefile /ABC/ '{*}'

Die Ausgabedateien sind standardmäßig xx00, , ..., Sie können das Format und die Nummerierung jedoch bei Bedarf ändern - siehexx01man csplit

Question 2

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

Das obige Verfahren teilt die Datei wie gewünscht auf, unabhängig davon, wie viele Instanzen der Markierungslinie vorhanden sind, und entfernt dann die Markierung aus den resultierenden Dateien. Die Ausgabedateien werden z. B. splitfile_00, splitfile_01usw. genannt.

Lassen Sie uns diesen Teil am Ende des csplitAufrufs auseinandernehmen: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}": Wir verwenden die Subshell, grepum die Anzahl der Instanzen Ihres Markers in der Datei zu ermitteln und eins abzuziehen. Dadurch erfahren wir csplitgenau, wie viele Teilungen vorgenommen werden.

Beachten Sie, dass, wie geschrieben, etwas schiefgehen kann, wenn Ihr Marker in den Daten erscheint.

Answer

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

Das obige Verfahren teilt die Datei wie gewünscht auf, unabhängig davon, wie viele Instanzen der Markierungslinie vorhanden sind, und entfernt dann die Markierung aus den resultierenden Dateien. Die Ausgabedateien werden z. B. splitfile_00, splitfile_01usw. genannt.

Lassen Sie uns diesen Teil am Ende des csplitAufrufs auseinandernehmen: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}": Wir verwenden die Subshell, grepum die Anzahl der Instanzen Ihres Markers in der Datei zu ermitteln und eins abzuziehen. Dadurch erfahren wir csplitgenau, wie viele Teilungen vorgenommen werden.

Beachten Sie, dass, wie geschrieben, etwas schiefgehen kann, wenn Ihr Marker in den Daten erscheint.

Datei basierend auf Muster in mehrere Dateien aufteilen

Antwort1

Antwort2

verwandte Informationen