
私は、大量の PO を処理する購買部門を持つ組織で働いています。購買部門が PO ジョブを PDF に「印刷」すると、結果として得られる PDF には 1 つ以上の注文書のページが含まれることがあります。
たとえば、PDF には合計 6 ページありますが、1 ~ 2 ページは 1 つの PO 用、3 ~ 4 ページは 1 つの PO 用、5 ~ 10 ページは 3 つ目の PO 用です。各 PO には、別の PO の最初のページに「Purchase Order」という語句があります。
以前生成した PDF を分割して、各 PDF が別々の PO 用になるようにしたいと考えています。pdftk または同様のツールを使用して、キーワード「Purchase Order」に基づいて PDF を分割する方法はありますか? 分割後の各 PDF には、各 PO のページのみが含まれる必要があります。PO あたりのページ数は PO ごとに異なるため、2 ページごとに分割するなどの標準値は使用できません。そのため、「Purchase Order」という単語を区切り文字として使用して、元の PDF をどこで分割するかを知る必要があります。
これに役立つヒントやサンプル スクリプト (bash) をお持ちの方がいらっしゃいましたら、大変助かります。
ありがとう、クリス