根據關鍵字將 pdf 拆分為單獨的文件

根據關鍵字將 pdf 拆分為單獨的文件

我在一個設有採購部門的組織工作。處理大量 PO。當他們將 PO 作業「列印」為 pdf 時,產生的 pdf 可以包含一個或多個採購訂單的頁面。

例如,pdf 總共可能有 6 頁,但第 1-2 頁用於一個 PO,第 3-4 頁用於一個 PO,第 5-10 頁用於第三個 PO。每個 PO 在另一個 PO 的首頁上都有「採購訂單」字樣。

他們現在希望拆分先前產生的 pdf,以便每個 pdf 都針對一個單獨的 PO。有沒有辦法使用pdftk或類似工具根據關鍵字「採購訂單」拆分pdf?分割後的每個 pdf 應僅包含每個 PO 的頁數。每個採購訂單的頁數因採購訂單而異,因此我無法使用像每2 頁拆分這樣的標準值,這就是為什麼需要使用“採購訂單”一詞作為分隔符來知道在哪裡拆分原始pdf 。

如果有人有任何提示或範例腳本(bash)來幫助解決此問題,我將非常感激。

謝謝,克里斯

相關內容