Überbeanspruchung der CPU beim Replizieren eines Gluster-Volumes

Überbeanspruchung der CPU beim Replizieren eines Gluster-Volumes

Ich habe dieses Szenario:

srv01 srv02 srv03

Auf srv03 läuft ein Gluster-Volume „vol1“, das alle Server für E/A verwenden können. Vol1 enthält viele gemischte Nebenabbilder in der Größenordnung von einigen KB bis zu 3–4 MB. Die Gesamtmenge beträgt ungefähr 1,5 TB.

Die Gluster-Version ist 3.6.2

Es ist kein Allheilmittel und muss etwas angepasst werden, funktioniert aber ziemlich gut.

Jetzt muss ich den Brick von srv03 auf die anderen Server replizieren.

Das Problem besteht darin, dass die CPU-Auslastung von srv03 auf 100 % hochschnellt und normale Anfragen nicht bearbeiten kann. Der Netzverkehr ist gering.

Optionen sind:

cluster.data-self-heal-algorithm: voll

cluster.self-heal-daemon: aus

Leistung.Cache-Größe: 1 GB

Ich muss den Dienst am Laufen halten, während die Replikation läuft. Ihre Vorschläge sind willkommen

Antwort1

Ich arbeite gerade an einer ähnlichen Situation. Wenn Ihr Engpass die CPU ist, denke ich, dass eine Verringerung cluster.background-self-heal-counthelfen sollte (Standard ist 16). Mit anderen Worten: „Wenn Ihr Client versucht, 17 Dateien zu öffnen, bleibt er bei der 17. hängen und wartet auf eine Selbstheilung“ (https://botbot.me/freenode/gluster/msg/45681458/).

verwandte Informationen