중복 제거를 사용할 가치가 있는지 평가하는 방법은 무엇입니까?

중복 제거를 사용할 가치가 있는지 평가하는 방법은 무엇입니까?

중복 제거 사용을 고려 중인 파티션이 있습니다.

데이터의 프로필을 보면 좋은 선택이 될 것이라고 생각합니다. 그래도 하기 전에 '느낌'보다는 좀 더 체계적으로 임팩트를 평가해보고 싶다.

중복 제거가 파티션에 미치는 영향을 평가하는 도구가 있습니까? (파일 수준 또는 블록 수준)

지금은 ubuntu와 ext4를 사용하고 있지만, 이 상황에서 중복 제거가 유용하다고 판단되면 opendedup이나 lessfs 사용을 고려하고 있습니다. 다른 제안은 다른 배포판/무료 *nix를 사용하는 것을 의미할 수도 있습니다.

답변1

어떤 파일 시스템을 지정하지 않았습니다. ZFS에 대해 이야기하는 경우 zdb 명령을 사용하여 중복 제거를 켜면 어떤 효과가 있는지 확인할 수 있습니다.

# zdb -S tank
Simulated DDT histogram:

bucket              allocated                       referenced          
______   ______________________________   ______________________________
refcnt   blocks   LSIZE   PSIZE   DSIZE   blocks   LSIZE   PSIZE   DSIZE
------   ------   -----   -----   -----   ------   -----   -----   -----
     1      775   96.8M   96.8M   96.8M      775   96.8M   96.8M   96.8M
     2        2    256K    256K    256K        6    768K    768K    768K
     4        3    384K    384K    384K       13   1.62M   1.62M   1.62M
   128        1    128K    128K    128K      158   19.8M   19.8M   19.8M
 Total      781   97.5M   97.5M   97.5M      952    119M    119M    119M

dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22

관련 정보