키워드에 따라 PDF를 별도의 파일로 분할

키워드에 따라 PDF를 별도의 파일로 분할

저는 구매 부서가 있는 조직에서 일하고 있습니다. 많은 PO를 처리합니다. PO 작업을 PDF로 "인쇄"하면 결과 PDF에는 하나 이상의 구매 주문서에 대한 페이지가 포함될 수 있습니다.

예를 들어 PDF에 총 6페이지가 있을 수 있지만 1~2페이지는 하나의 PO에, 3~4페이지는 하나의 PO에, 5~10페이지는 세 번째 PO에 해당합니다. 각 PO에는 다른 PO의 첫 페이지에 "구매 주문"이라는 단어가 있습니다.

이제 그들은 이전에 생성된 PDF를 분할하여 각 PDF가 별도의 PO에 사용되도록 하기를 원합니다. pdftk 또는 유사한 도구를 사용하여 "구매 주문" 키워드를 기반으로 pdf를 분할하는 방법이 있습니까? 분할 후 각 PDF에는 각 PO에 대한 페이지만 있어야 합니다. PO당 페이지 수는 PO마다 다르기 때문에 2페이지마다 분할하는 것과 같은 표준 값을 사용할 수 없습니다. 이것이 바로 원본 PDF를 분할할 위치를 알기 위해 "구매 주문" 단어를 구분 기호로 사용해야 하는 이유입니다.

누구든지 이 작업에 도움이 되는 팁이나 예제 스크립트(bash)가 있으면 매우 감사하겠습니다.

고마워요, 크리스

관련 정보