Tengo una partición en la que estoy considerando utilizar la deduplicación.
Por el perfil de sus datos creo que será una buena elección. Aún así, antes de hacerlo, me gustaría evaluar el impacto de una forma más sistemática que "sentir".
¿Existe alguna herramienta que evalúe el impacto de la deduplicación en una partición? (ya sea a nivel de archivo o a nivel de bloque).
Por ahora tengo ubuntu y ext4, pero si la deduplicación resulta valiosa en esta situación, estoy considerando usar opendedup o lessfs. Cualquier otra sugerencia, incluso si eso podría significar usar una distribución diferente / *nix gratuito.
Respuesta1
No especificaste qué sistema de archivos. Si estás hablando de ZFS, puedes usar el comando zdb para ver qué efecto habría tenido activar la dedup:
# zdb -S tank
Simulated DDT histogram:
bucket allocated referenced
______ ______________________________ ______________________________
refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE
------ ------ ----- ----- ----- ------ ----- ----- -----
1 775 96.8M 96.8M 96.8M 775 96.8M 96.8M 96.8M
2 2 256K 256K 256K 6 768K 768K 768K
4 3 384K 384K 384K 13 1.62M 1.62M 1.62M
128 1 128K 128K 128K 158 19.8M 19.8M 19.8M
Total 781 97.5M 97.5M 97.5M 952 119M 119M 119M
dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22