壓縮許多相似的大圖像？

Question 1

我不知道有哪個特定的軟體可以做到這一點，但有一些關於這個主題的研究。例如，參見文章壓縮相似影像集作者：Samy Ait-Aoudia、Abdelhalim Gabis、Amina Naimi 和使用混合壓縮模型壓縮相似影像集作者：Jiann-Der Lee、Shu-Yen Wan、Chemg-Min Ma、Rui-Feng Wu。

在更實際的層面上，您可以擴展您的減法技術，例如透過編寫一個使用圖像魔術師計算連續影像之間的差異，將結果儲存為 jpeg（如果希望無損，則儲存為壓縮 png）。您將獲得一個基本映像和一組應該小得多的壓縮「增量」映像。使用 ImageMagick 計算差異：

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

透過加回來重新計算：

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

（您可以使用 jpg 來執行相同的操作，並節省大量空間）。

Answer

我不知道有哪個特定的軟體可以做到這一點，但有一些關於這個主題的研究。例如，參見文章壓縮相似影像集作者：Samy Ait-Aoudia、Abdelhalim Gabis、Amina Naimi 和使用混合壓縮模型壓縮相似影像集作者：Jiann-Der Lee、Shu-Yen Wan、Chemg-Min Ma、Rui-Feng Wu。

在更實際的層面上，您可以擴展您的減法技術，例如透過編寫一個使用圖像魔術師計算連續影像之間的差異，將結果儲存為 jpeg（如果希望無損，則儲存為壓縮 png）。您將獲得一個基本映像和一組應該小得多的壓縮「增量」映像。使用 ImageMagick 計算差異：

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

透過加回來重新計算：

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

（您可以使用 jpg 來執行相同的操作，並節省大量空間）。

Question 2

希望其他想要壓縮類似圖像/PNG 並透過搜尋找到這裡的人：

我不確定我所研究的用例如何應用於操作照片，因為該連結不再有效。我的用例相似但不相同 - 我希望壓縮非常相似的電腦程式螢幕截圖，因此可能比僅僅壓縮 PNG 檔案更具壓縮性。我透過搜尋找不到解決方案，所以我想出了自己的解決方案，最終得到了瘋狂的 4.4% 壓縮率（而不是透過簡單地壓縮 PNG 得到的 96% 的壓縮率）：

我的資料集是 300 個 1920x1080 的 PNG 文件，原始大小為 431.8mb，使用我能找到的 bz2、7z 和類似工具的最佳設定壓縮後大小僅為 417.4mb。我的理解是，原始檔案在 PNG 層級上壓縮得併不理想，因為各種 PNG 最小化工具設法將每個檔案的原始大小從大約 1.4mb 減少到 900kb。

我的想法是，問題在於壓縮工具無法確定資料已經被壓縮，而原始資料中的微小變化可能會導致截然不同的壓縮檔案。因此，我使用設定解壓縮文件ffmpeg，據我了解，這些設定不會導致任何資料遺失：

for FILE in screenshot-2024*; do ffmpeg -loglevel error -i $FILE -vframes 1 -compression_algo raw -pix_fmt rgb24 $FILE.tiff; done

這將單一檔案大小從 1.4 增加到 6mb，但使用 7z/LZMA2 壓縮導致產生的檔案大小極低，為 19.175.127 位元組，這意味著壓縮量僅為原始大小的 4.4%。

可以透過以下方式將.tiff文件重新轉換為：.png

for FILE in screenshot-2024*.tiff; do ffmpeg -loglevel error -i $FILE $FILE.png; done

重複的文件結尾當然可以糾正，但這樣在測試時就不會覆蓋您的原始來源。

我們用於壓縮的設定如下：該Solid block size設定似乎對輸出大小有最大的影響：

壓縮等級：9/超高
壓縮方式：LZMA2
字典大小：512 MB
字數：256
固體塊大小：512 MB
壓縮記憶體使用量：12 GB

由於我們的目標是長期存儲，因此額外的箍和壓縮時間並不是一個大因素，當然，您的里程可能會有所不同。

Answer