クライアントから PDF 形式で提供された PDF カタログがあります。画像はありませんが、PDF には含まれています。
元のファイル名を保持しながら、コマンドライン ツールを使用して PDF からすべての画像を抽出する方法はありますか?
この質問をここで確認しました:レイヤーマスクを使用してPDFから画像を抽出する ただし、これは個々の画像用です。
答え1
pdfimages
パッケージのプログラムはpoppler-utils
あなたが探しているものかもしれません。マニュアルページから:
Pdfimages は PDF ファイルを読み取り、1 ページ以上をスキャンし、各画像に対して 1 つの PPM、PBM、または JPEG ファイルを書き込みます。
新しいバージョンではall
poppler-utils には、jpg または png に抽出するためのスイッチがあります。
pdfimages -all input.pdf images/prefix
次のような形式でファイルを出力しますプレフィックス-nnn.[png|jpg]の中に画像フォルダ。