パターンに基づいてファイルを複数のファイルに分割する

Question 1

使用csplit

csplit -z somefile /ABC/ '{*}'

出力ファイルはデフォルトではxx00、、、xx01...になりますが、必要に応じて形式と番号を変更できます。man csplit

Answer

使用csplit

csplit -z somefile /ABC/ '{*}'

出力ファイルはデフォルトではxx00、、、xx01...になりますが、必要に応じて形式と番号を変更できます。man csplit

Question 2

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

上記は、マーカー行のインスタンスがいくつあっても、要求どおりにファイルを分割し、結果のファイルからマーカーを削除します。出力ファイルは、たとえば、などと呼ばれsplitfile_00ますsplitfile_01。

呼び出しの最後の部分を分解しますcsplit: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}": サブシェルを使用してgrep、ファイル内のマーカーのインスタンスの数を取得し、1 を減算します。これにより、csplit分割が正確に何回行われるかがわかります。

記載されているとおり、マーカーがデータ内に現れると、事態が悪化する可能性があることに注意してください。

Answer

NEEDLE=ABC
HAYSTACK=/path/to/bigfile
csplit -f splitfile_ $HAYSTACK /$NEEDLE/ "{$(($(grep -c -- $NEEDLE $HAYSTACK)-1))}"
for file in splitfile_*; do
    sed --in-place "s/$NEEDLE//" $file
done

上記は、マーカー行のインスタンスがいくつあっても、要求どおりにファイルを分割し、結果のファイルからマーカーを削除します。出力ファイルは、たとえば、などと呼ばれsplitfile_00ますsplitfile_01。

呼び出しの最後の部分を分解しますcsplit: "{$(($(grep -c $NEEDLE HAYSTACK)-1))}": サブシェルを使用してgrep、ファイル内のマーカーのインスタンスの数を取得し、1 を減算します。これにより、csplit分割が正確に何回行われるかがわかります。

記載されているとおり、マーカーがデータ内に現れると、事態が悪化する可能性があることに注意してください。

パターンに基づいてファイルを複数のファイルに分割する

答え1

答え2

関連情報