ZFS unter Linux: Komprimierung und Deduplizierungsreihenfolge

Question

Es stellt sich heraus, dasshttp://docs.oracle.com/cd/E36784_01/html/E36835/gkknx.htmlist richtig.

Beim Schreiben einer Datei werden die Daten komprimiert, verschlüsselt und die Prüfsumme überprüft. Anschließend werden die Daten, sofern möglich, dedupliziert.

Meine Annahme mit der zufälligen Datei war falsch. Es scheint, dass ZFS die Komprimierung abbricht, wenn es eine bestimmte Mindestkomprimierungsrate nicht erreichen kann.

Zitat aushttps://wiki.illumos.org/display/illumos/LZ4+Compression

Besonders hervorzuheben ist auch die sehr hohe Leistung von LZ4 bei inkomprimierbaren Daten. Dies wird durch die Integration eines „Early Abort“-Mechanismus erreicht, der ausgelöst wird, wenn LZ4 die erwartete Mindestkomprimierungsrate (12,5 % bei ZFS) nicht erreichen kann.

Zum Testen habe ich mit eine Textdatei aus meinem Dateisystem erstellt find / >> tree.txt.

Nach dem Kopieren der Datei in beide Datensätze zpool get dedupratioerfolgte die Rückgabe:

NAME  PROPERTY    VALUE  SOURCE
tank  dedupratio  1.00x  -

Deduplizierung ist eigentlich der letzte Teil dieser Schreibkette. Die Wahl anderer Komprimierungsalgorithmen führt zu einer schlechten Deduplizierungsrate!

Leider unterstützt meine ZoL-Version keine Verschlüsselung. Es scheint jedoch, dass die Verschlüsselung verschiedener Datensätze auch die Deduplizierung beeinträchtigen könnte. Informationen zur Verschlüsselung:https://docs.oracle.com/cd/E53394_01/html/E54801/gkkih.html

Answer 1