zfs на Linux сжатие и порядок дедупликации

Question

Оказывается, чтоhttp://docs.oracle.com/cd/E36784_01/html/E36835/gkknx.htmlверно.

При записи файла данные сжимаются, шифруются, проверяется контрольная сумма. Затем данные дедуплицируются, если это возможно.

Мое предположение о случайном файле было неверным. Похоже, что ZFS прерывает сжатие, если не может достичь определенного минимального коэффициента сжатия.

цитата изhttps://wiki.illumos.org/display/illumos/LZ4+Сжатие

Еще одна важная вещь, которую следует отметить, заключается в том, что производительность LZ4 на несжимаемых данных очень высока. Это достигается за счет включения механизма «раннего прерывания», который срабатывает, если LZ4 не может достичь ожидаемого минимального коэффициента сжатия (12,5% на ZFS).

Для тестирования я создал текстовый файл из своей файловой системы с расширением find / >> tree.txt.

После копирования файла в оба набора данных и последующего zpool get dedupratioвозврата:

NAME  PROPERTY    VALUE  SOURCE
tank  dedupratio  1.00x  -

Дедупликация — это действительно последняя часть в этой цепочке записи. Выбор других алгоритмов сжатия приведет к плохой дедупликации!

К сожалению, моя ZoL-версия не поддерживает шифрование. Но, похоже, шифрование разных наборов данных также может испортить дедупликацию. Информация о шифровании:https://docs.oracle.com/cd/E53394_01/html/E54801/gkkih.html

Answer 1