나는 다음과 같은 시나리오를 가지고 있습니다.
srv01 srv02 srv03
srv03에서 실행 중인 Gluster 볼륨 "vol1"이 있고 모든 서버가 I/O에 사용할 수 있습니다. vol1에는 몇 kbs에서 3-4Mb에 이르는 많은 혼합 측면 이미지가 포함되어 있으며 총 용량은 약 1.5TB입니다.
Gluster 버전은 3.6.2입니다.
만능은 아니고 약간의 튜닝이 필요하지만 꽤 잘 작동합니다.
이제 srv03의 브릭을 다른 서버에 복제해야 합니다.
문제는 srv03의 CPU가 100%까지 치솟아 정상적인 요청을 처리할 수 없다는 것입니다. 순 트래픽이 낮습니다.
옵션은 다음과 같습니다:
Cluster.data-self-heal-algorithm: 전체
Cluster.self-heal-daemon: 꺼짐
성능.캐시 크기: 1GB
복제가 실행되는 동안 서비스를 계속 실행해야 합니다. 귀하의 제안을 환영합니다.
답변1
나는 비슷한 상황에 어떻게 든 노력하고 있습니다. 병목 현상이 CPU에 있는 경우 감소하는 것이 cluster.background-self-heal-count
도움이 될 것이라고 생각합니다(기본값은 16). 즉, "클라이언트가 17개의 파일을 열려고 하면 17일에 자체 복구를 기다리며 정지됩니다."(https://botbot.me/freenode/gluster/msg/45681458/).