Divida el pdf en archivos separados según las palabras clave

Divida el pdf en archivos separados según las palabras clave

Trabajo en una organización con un departamento de Compras. que procesa muchas órdenes de compra. Cuando "imprimen" un trabajo de orden de compra en pdf, el pdf resultante puede tener páginas para una o más órdenes de compra.

Por ejemplo, el pdf puede tener 6 páginas en total, pero las páginas 1 y 2 son para una orden de compra, las páginas 3 y 4 son para una orden de compra y las páginas 5 a 10 son para una tercera orden de compra. Cada orden de compra tiene las palabras "Orden de compra" en la primera página de otra orden de compra.

Ahora quieren dividir los archivos PDF generados previamente para que cada archivo PDF sea para una orden de compra separada. ¿Hay alguna forma de utilizar pdftk o una herramienta similar para dividir el pdf según las palabras clave "Orden de compra"? Cada pdf después de dividirlo debe tener solo las páginas para cada orden de compra. El número de páginas por orden de compra varía de una orden de compra a otra, por lo que no puedo usar un valor estándar como dividir cada 2 páginas, es por eso que las palabras "Orden de compra" deben usarse como delimitador para saber dónde dividir el pdf original.

Si alguien tiene algún consejo o script de ejemplo (bash) para ayudar con esto, estaría muy agradecido.

Gracias, cris

información relacionada