多数の類似した大きな画像を圧縮しますか?

Question 1

これを行う特定のソフトウェアは知りませんが、このテーマに関する研究はいくつかあります。たとえば、以下の記事をご覧ください。類似画像セットの圧縮サミー・アイト・アウディア、アブデルハリム・ガビス、アミナ・ナイミ、ハイブリッド圧縮モデルを使用して類似画像セットを圧縮する著者：Jiann-Der Lee、Shu-Yen Wan、Chemg-Min Ma、Rui-Feng Wu。

より実用的なレベルでは、減算のテクニックを拡張することができます。たとえば、次のようなスクリプトを書くことができます。イメージマジック連続する画像間の差を計算し、結果を jpeg (ロスレスにしたい場合は圧縮された png) として保存します。1 つの基本画像と、それよりはるかに小さい圧縮された「デルタ」画像のセットが得られます。ImageMagick を使用して差を計算するには、次のようにします。

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

追加して再計算するには:

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

(代わりに jpg を使用して同じことを行うと、多くのスペースを節約できます)。

Answer

これを行う特定のソフトウェアは知りませんが、このテーマに関する研究はいくつかあります。たとえば、以下の記事をご覧ください。類似画像セットの圧縮サミー・アイト・アウディア、アブデルハリム・ガビス、アミナ・ナイミ、ハイブリッド圧縮モデルを使用して類似画像セットを圧縮する著者：Jiann-Der Lee、Shu-Yen Wan、Chemg-Min Ma、Rui-Feng Wu。

より実用的なレベルでは、減算のテクニックを拡張することができます。たとえば、次のようなスクリプトを書くことができます。イメージマジック連続する画像間の差を計算し、結果を jpeg (ロスレスにしたい場合は圧縮された png) として保存します。1 つの基本画像と、それよりはるかに小さい圧縮された「デルタ」画像のセットが得られます。ImageMagick を使用して差を計算するには、次のようにします。

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

追加して再計算するには:

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

(代わりに jpg を使用して同じことを行うと、多くのスペースを節約できます)。

Question 2

同様の画像/PNG を圧縮しようとしていて、検索を通じてここにたどり着いた他の人たちの期待に応えるために:

リンクが機能しなくなったため、比較に取り組んだユースケースがオペレーションの写真にどのように適用されるかはわかりません。私のユースケースは似ていますが同じではありません。非常によく似たコンピュータプログラムのスクリーンショットを圧縮しようとしていたので、PNG ファイルを単に zip で圧縮するよりもはるかに圧縮しやすい可能性があります。検索しても解決策が見つからなかったので、独自の方法を思いつき、最終的に 4.4% という驚異的な圧縮率を達成しました (PNG を単純に圧縮する単純な使用では 96% でした)。

私のデータセットは、1920x1080 の PNG ファイル 300 個で、生のサイズは 431.8 MB でしたが、bz2、7z などのツールで見つけることができた最適な設定で、わずか 417.4 MB に圧縮されました。私の理解では、さまざまな PNG 縮小ツールによって生のサイズがファイルあたり約 1.4 MB から 900 KB に削減されたため、ソースファイルは PNG レベルでは理想的に圧縮されていなかったようです。

私の考えでは、問題は圧縮ツールがデータがすでに圧縮されていることを認識できず、生のデータの小さな変更によって圧縮ファイルが大きく異なる可能性があるということでした。そこで、ffmpeg私の理解ではデータ損失が発生しない設定を使用してファイルを解凍しました。

for FILE in screenshot-2024*; do ffmpeg -loglevel error -i $FILE -vframes 1 -compression_algo raw -pix_fmt rgb24 $FILE.tiff; done

これにより、個々のファイルサイズは 1.4 MB から 6 MB に増加しましたが、7z/LZMA2 による圧縮により、結果のファイルサイズは 19,175,127 バイトと非常に小さくなり、元のサイズのわずか 4.4% に圧縮されました。

.tiffファイルの再変換は次のよう.pngに実行できます。

for FILE in screenshot-2024*.tiff; do ffmpeg -loglevel error -i $FILE $FILE.png; done

重複したファイルの末尾はもちろん修正できますが、この方法ではテスト中に元のソースが上書きされることはありません。

圧縮に使用した設定は次のとおりです。このSolid block size設定は出力サイズに最も大きな影響を与えるようです。

圧縮レベル: 9/ウルトラ
圧縮方式: LZMA2
辞書サイズ: 512 MB
単語数: 256
ソリッドブロックサイズ: 512 MB
圧縮時のメモリ使用量: 12 GB

私たちの目標は長期保管だったので、追加のフープや圧縮時間は大きな要素ではありませんでしたが、もちろん、結果は異なる可能性があります。

Answer