Linux-Schrittmacher - Split Brain verhindern

Question 1

tokenIch habe ein Token-Timeout in Corosync nie auf einen Wert über 10 Sekunden eingestellt, aber Sie könnten versuchen, den Wert in Ihrem corosync.confauf 120000(120 Sekunden in Millisekunden) zu erhöhen/einzustellen . Weitere Einzelheiten tokenfinden Sie im totem{}Abschnitt Ihres corosync.conf; .man corosync.conf

Dies sollte verhindern, dass Corosync einen Knoten für 120 Sekunden für tot erklärt, wenn das Netzwerk ausfällt.

Answer

tokenIch habe ein Token-Timeout in Corosync nie auf einen Wert über 10 Sekunden eingestellt, aber Sie könnten versuchen, den Wert in Ihrem corosync.confauf 120000(120 Sekunden in Millisekunden) zu erhöhen/einzustellen . Weitere Einzelheiten tokenfinden Sie im totem{}Abschnitt Ihres corosync.conf; .man corosync.conf

Dies sollte verhindern, dass Corosync einen Knoten für 120 Sekunden für tot erklärt, wenn das Netzwerk ausfällt.

Question 2

Sie können das Überwachungsintervall der Ressource mit ändern, op monitor interval=Nswobei Ndie Anzahl der Sekunden ist, und dann migration-thresholdfür die Ressource auf festlegen 2. Beachten Sie, dass bei einer Einstellung von 120seine Gesamtverzögerung von 120–240 Sekunden auftreten kann, je nachdem, wann der erste Fehler im Überwachungsintervall auftritt.

Es gibt noch weitere Einschränkungen, da der Fehlerzähler migration-thresholdbei Erfolg nicht zurückgesetzt wird. Dazu müssten Sie ihn ebenfalls festlegen failure-timeoutoder manuell eingreifen.

Mit op monitor interval=120s, migration-threshold=2, failure-timeout=121sund Ihrer resource-stickinessEinstellung müssten Sie testen, ob dies die erwartete Funktionalität bietet und wie sich die Fehlerzähler verhalten, wenn der ursprüngliche Master wiederhergestellt wird. Es könnte ein manuelles Eingreifen erforderlich sein, aber da bin ich mir nicht 100 % sicher

Answer

Sie können das Überwachungsintervall der Ressource mit ändern, op monitor interval=Nswobei Ndie Anzahl der Sekunden ist, und dann migration-thresholdfür die Ressource auf festlegen 2. Beachten Sie, dass bei einer Einstellung von 120seine Gesamtverzögerung von 120–240 Sekunden auftreten kann, je nachdem, wann der erste Fehler im Überwachungsintervall auftritt.

Es gibt noch weitere Einschränkungen, da der Fehlerzähler migration-thresholdbei Erfolg nicht zurückgesetzt wird. Dazu müssten Sie ihn ebenfalls festlegen failure-timeoutoder manuell eingreifen.

Mit op monitor interval=120s, migration-threshold=2, failure-timeout=121sund Ihrer resource-stickinessEinstellung müssten Sie testen, ob dies die erwartete Funktionalität bietet und wie sich die Fehlerzähler verhalten, wenn der ursprüngliche Master wiederhergestellt wird. Es könnte ein manuelles Eingreifen erforderlich sein, aber da bin ich mir nicht 100 % sicher

Linux-Schrittmacher - Split Brain verhindern

Antwort1

Antwort2

verwandte Informationen