Uso excesivo de la CPU al replicar un volumen Gluster

Uso excesivo de la CPU al replicar un volumen Gluster

Tengo este escenario:

srv01 srv02 srv03

hay un volumen de gluster "vol1" ejecutándose en srv03, y todos los servidores pueden usarlo para E/S. vol1 contiene muchas imágenes laterales mixtas, que van desde unos pocos kbs hasta 3-4 Mb. La cantidad total es de aproximadamente 1,5 TB.

La versión de Gluster es 3.6.2

No es una solución milagrosa, necesita algunos ajustes, pero funciona bastante bien.

Ahora tengo que replicar el bloque de srv03 en los otros servidores.

El problema es que la CPU de srv03 se dispara al 100% y no puede atender las solicitudes normales. El tráfico neto es bajo.

Las opciones son:

algoritmo cluster.data-self-heal: completo

cluster.self-heal-daemon: desactivado

rendimiento.tamaño de caché: 1 gb

Debo mantener el servicio en ejecución mientras se ejecuta la replicación. Sus sugerencias son bienvenidas.

Respuesta1

De alguna manera estoy trabajando en una situación similar. Si su cuello de botella es la CPU, creo que disminuir cluster.background-self-heal-countdebería ayudar (el valor predeterminado es 16). En otras palabras, "cuando su cliente intente abrir 17 archivos, se bloqueará en el 17 esperando una autocuración" (https://botbot.me/freenode/gluster/msg/45681458/).

información relacionada