¿Cómo evaluar si vale la pena utilizar la deduplicación?

¿Cómo evaluar si vale la pena utilizar la deduplicación?

Tengo una partición en la que estoy considerando utilizar la deduplicación.

Por el perfil de sus datos creo que será una buena elección. Aún así, antes de hacerlo, me gustaría evaluar el impacto de una forma más sistemática que "sentir".

¿Existe alguna herramienta que evalúe el impacto de la deduplicación en una partición? (ya sea a nivel de archivo o a nivel de bloque).

Por ahora tengo ubuntu y ext4, pero si la deduplicación resulta valiosa en esta situación, estoy considerando usar opendedup o lessfs. Cualquier otra sugerencia, incluso si eso podría significar usar una distribución diferente / *nix gratuito.

Respuesta1

No especificaste qué sistema de archivos. Si estás hablando de ZFS, puedes usar el comando zdb para ver qué efecto habría tenido activar la dedup:

# zdb -S tank
Simulated DDT histogram:

bucket              allocated                       referenced          
______   ______________________________   ______________________________
refcnt   blocks   LSIZE   PSIZE   DSIZE   blocks   LSIZE   PSIZE   DSIZE
------   ------   -----   -----   -----   ------   -----   -----   -----
     1      775   96.8M   96.8M   96.8M      775   96.8M   96.8M   96.8M
     2        2    256K    256K    256K        6    768K    768K    768K
     4        3    384K    384K    384K       13   1.62M   1.62M   1.62M
   128        1    128K    128K    128K      158   19.8M   19.8M   19.8M
 Total      781   97.5M   97.5M   97.5M      952    119M    119M    119M

dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22

información relacionada