Разделить файл на несколько файлов на основе шаблона

Question 1

С использованиемcsplit

csplit -z somefile /ABC/ '{*}'

Выходные файлы будут иметь вид xx00, xx01, ... по умолчанию, но при желании вы можете изменить формат и нумерацию — см.man csplit

Answer

С использованиемcsplit

csplit -z somefile /ABC/ '{*}'

Выходные файлы будут иметь вид xx00, xx01, ... по умолчанию, но при желании вы можете изменить формат и нумерацию — см.man csplit

Question 2

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

Вышеуказанное разделит файл, как запрошено, независимо от того, сколько экземпляров линии маркера у вас есть, а затем удалит маркер из результирующих файлов. Выходные файлы будут называться, например splitfile_00, splitfile_01, и так далее.

Разберем этот фрагмент в конце вызова csplit: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}"Мы используем подоболочку, grepчтобы получить количество экземпляров вашего маркера в файле, и вычитаем единицу — это csplitточно сообщает, сколько разделений он собирается сделать.

Обратите внимание, что, как написано выше, все может пойти не так, если ваш маркер появится в данных.

Answer

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

Вышеуказанное разделит файл, как запрошено, независимо от того, сколько экземпляров линии маркера у вас есть, а затем удалит маркер из результирующих файлов. Выходные файлы будут называться, например splitfile_00, splitfile_01, и так далее.

Разберем этот фрагмент в конце вызова csplit: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}"Мы используем подоболочку, grepчтобы получить количество экземпляров вашего маркера в файле, и вычитаем единицу — это csplitточно сообщает, сколько разделений он собирается сделать.

Обратите внимание, что, как написано выше, все может пойти не так, если ваш маркер появится в данных.

Разделить файл на несколько файлов на основе шаблона

решение1

решение2

Связанный контент