Сжимаете много похожих больших изображений?

Question 1

Я не знаю конкретного ПО, которое это делает, но есть некоторые исследования на эту тему. Например, см. статьиСжатие наборов похожих изображенийСами Айт-Аудиа, Абдельхалим Габис, Амина Наими иСжатие наборов похожих изображений с использованием гибридной модели сжатияЦзянь-Дер Ли, Шу-Йен Вань, Чемг-Мин Ма, Руй-Фэн У.

На более практическом уровне вы можете расширить свою технику вычитания, например, написав скрипт, который используетImageMagickдля вычисления разницы между последовательными изображениями, сохраняя результат как jpeg (или сжатый png, если вы хотите без потерь). Вы получите одно базовое изображение и набор сжатых "дельта"-изображений, которые должны быть намного меньше. Для вычисления разницы с помощью ImageMagick:

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

Для повторного вычисления путем добавления:

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

(Вы можете сделать то же самое, используя jpg, и сэкономить много места).

Answer

Я не знаю конкретного ПО, которое это делает, но есть некоторые исследования на эту тему. Например, см. статьиСжатие наборов похожих изображенийСами Айт-Аудиа, Абдельхалим Габис, Амина Наими иСжатие наборов похожих изображений с использованием гибридной модели сжатияЦзянь-Дер Ли, Шу-Йен Вань, Чемг-Мин Ма, Руй-Фэн У.

На более практическом уровне вы можете расширить свою технику вычитания, например, написав скрипт, который используетImageMagickдля вычисления разницы между последовательными изображениями, сохраняя результат как jpeg (или сжатый png, если вы хотите без потерь). Вы получите одно базовое изображение и набор сжатых "дельта"-изображений, которые должны быть намного меньше. Для вычисления разницы с помощью ImageMagick:

convert image2.png image1.png -compose MinusSrc -composite -depth 24 -define png:compression-filter=2 -define png:compression-level=9 -define png:compression-strategy=1 difference-2-1.png

Для повторного вычисления путем добавления:

convert image1.png difference-2-1.png -compose Plus -composite image2-reconstructed.png

(Вы можете сделать то же самое, используя jpg, и сэкономить много места).

Question 2

В надежде, что другие люди, желающие сжать похожие изображения/PNG-файлы и нашедшие их здесь через поиск:

Я не уверен, как вариант использования, над которым я работал, будет применяться к фотографиям ops, поскольку ссылка больше не работает. Мой вариант использования был похож, но не тот же самый — я хотел сжать скриншоты компьютерных программ, которые очень похожи, поэтому потенциально гораздо более сжимаемы, чем просто архивация файлов PNG. Я не смог найти решения с помощью поиска, поэтому придумал свое собственное и в итоге получил безумный коэффициент сжатия 4,4% (в отличие от 96% при наивном использовании простого сжатия PNG):

Мой набор данных состоял из 300 файлов PNG с разрешением 1920x1080 и исходным размером 431,8 МБ, которые были сжаты до 417,4 МБ с лучшими настройками, которые я смог найти для bz2, 7z и подобных инструментов. Насколько я понимаю, исходные файлы не были идеально сжаты на уровне PNG, поскольку различные инструменты минимизации PNG смогли уменьшить исходный размер примерно с 1,4 МБ до 900 КБ на файл.

Я думал, что проблема в том, что инструменты сжатия не могут понять, что данные уже сжаты, и что небольшие изменения в исходных данных могут привести к совершенно другим сжатым файлам. Поэтому я распаковал файлы, используя ffmpegнастройки, которые, как я понимаю, не приводят к потере данных:

for FILE in screenshot-2024*; do ffmpeg -loglevel error -i $FILE -vframes 1 -compression_algo raw -pix_fmt rgb24 $FILE.tiff; done

Это увеличило размеры отдельных файлов с 1,4 до 6 МБ, но сжатие с помощью 7z/LZMA2 привело к получению файла невероятно малого размера — 19 175 127 байт, что означает сжатие всего до 4,4% от исходного размера.

Обратное преобразование .tiffфайлов .pngможно выполнить с помощью:

for FILE in screenshot-2024*.tiff; do ffmpeg -loglevel error -i $FILE $FILE.png; done

Конечно, можно исправить дублирующиеся окончания файлов, но в этом случае исходные исходники не будут перезаписаны во время тестирования.

Для сжатия мы использовали следующие настройки, причем эта Solid block sizeнастройка, по-видимому, оказывает наибольшее влияние на размер выходного файла:

Уровень сжатия: 9/Ультра
Метод сжатия: LZMA2
Размер словаря: 512 МБ
Размер слова: 256
Размер сплошного блока: 512 МБ
Использование памяти для сжатия: 12 ГБ

Поскольку нашей целью было долгосрочное хранение, дополнительные обручи и время сжатия не имели большого значения, конечно, ваш пробег может отличаться.

Answer