MySQL-Replikationsprobleme nach einem Stromausfall

Question 1

Ich habe mich für die erste Option entschieden.

Das funktionierte bis zu dem Punkt, an dem der Slave versuchte, Einfügungen vorzunehmen, die mit den Primärschlüsseln in Konflikt gerieten. Der Slave hatte mehr Arbeit erledigt, als das Binärprotokoll des Masters gespeichert hatte, wie bereits erwähnt. Ein Aspekt, den ich nicht erwartet hatte, war, dass der Slave Daten enthielt, die nicht im Master vorhanden waren; d. h. der Slave speicherte einige Transaktionen vor dem Stromausfall, den der MasterHATTE NICHTblieb bestehen.

Da es sich in meinem Fall nicht um zahlungsbezogene oder ähnliche Transaktionen handelte, habe ich die Daten vom Slave gelöscht (wodurch einige Daten verloren gingen, die zwar stattgefunden hatten, aber im Master nicht vorhanden waren) und die Replikation dann erneut ausgeführt. Dadurch wurden die Slaves vollständig auf den neuesten Stand gebracht. Wären die Daten wichtiger gewesen, hätten wir über ausreichende Auto-Increment-Offsets verfügt, um uns etwas Spielraum für die manuelle Bearbeitung der Daten zu geben und sicherzustellen, dass die referenzielle Integrität nicht beeinträchtigt wurde. Zum Glück mussten wir das in diesem Fall nicht tun.

Für eine Maschine in (passiver) Master-Master-Konfiguration, die sich in dieser misslichen Lage befand, habe ich einen ähnlichen Ansatz gewählt. Mit passivem Master-Master meine ich, dass wir einen aktiven Master (ServerA) haben, auf den alle Schreibvorgänge gehen, und einen passiven Master (ServerB), der dafür sorgt, dass Schemaaktualisierungen ohne Ausfallzeiten stattfinden können. Die Daten im aktiven Master (ServerA) wurden als die wahren Werte gewählt, obwohl wir wussten, dass wir dadurch einige persistente Transaktionen verloren, die nicht als wichtig erachtet wurden.

Die Protokolldatei und die Position auf dem Slave wurden geändert.

CHANGE MASTER MASTER_LOG_FILE='bin-log.004713', MASTER_LOG_POS=0; -- on serverB

Die Slave-Replikation wurde auf dem passiven Master (Server B) neu gestartet, bis sie, wie bei den anderen Slaves, aufgrund von Verletzungen der Primärschlüsseleinschränkung fehlschlug.
```
 START SLAVE; -- on serverB
```
Slave-Replikation vom passiven Master (ServerB) zum aktiven Master (ServerA) gestoppt.
```
STOP SLAVE; -- on serverA
```

LÖSCHEN Sie die Zeilen auf dem Slave (Server B), die im Master auf Server A nicht vorhanden waren.

DELETE FROM SOME_TABLE WHERE ID IN (???,????); -- on serverB
SHOW MASTER STATUS\G; -- get the new master log position on serverB

Verschieben Sie die Slave-Exec-Position des aktiven Masters (ServerA), um diese Löschungen vom passiven Master (ServerB) zu überspringen.
```
CHANGE MASTER TO MASTER_LOG_POS=???; --on serverA; use the value just obtained from serverB
```
Starten Sie die Replikation sowohl auf dem aktiven Master (Server A) als auch auf dem passiven Master neu.
```
START SLAVE; -- on both machines. serverA does nothing and serverB starts catching up.
```

Answer

Ich habe mich für die erste Option entschieden.

Das funktionierte bis zu dem Punkt, an dem der Slave versuchte, Einfügungen vorzunehmen, die mit den Primärschlüsseln in Konflikt gerieten. Der Slave hatte mehr Arbeit erledigt, als das Binärprotokoll des Masters gespeichert hatte, wie bereits erwähnt. Ein Aspekt, den ich nicht erwartet hatte, war, dass der Slave Daten enthielt, die nicht im Master vorhanden waren; d. h. der Slave speicherte einige Transaktionen vor dem Stromausfall, den der MasterHATTE NICHTblieb bestehen.

Da es sich in meinem Fall nicht um zahlungsbezogene oder ähnliche Transaktionen handelte, habe ich die Daten vom Slave gelöscht (wodurch einige Daten verloren gingen, die zwar stattgefunden hatten, aber im Master nicht vorhanden waren) und die Replikation dann erneut ausgeführt. Dadurch wurden die Slaves vollständig auf den neuesten Stand gebracht. Wären die Daten wichtiger gewesen, hätten wir über ausreichende Auto-Increment-Offsets verfügt, um uns etwas Spielraum für die manuelle Bearbeitung der Daten zu geben und sicherzustellen, dass die referenzielle Integrität nicht beeinträchtigt wurde. Zum Glück mussten wir das in diesem Fall nicht tun.

Für eine Maschine in (passiver) Master-Master-Konfiguration, die sich in dieser misslichen Lage befand, habe ich einen ähnlichen Ansatz gewählt. Mit passivem Master-Master meine ich, dass wir einen aktiven Master (ServerA) haben, auf den alle Schreibvorgänge gehen, und einen passiven Master (ServerB), der dafür sorgt, dass Schemaaktualisierungen ohne Ausfallzeiten stattfinden können. Die Daten im aktiven Master (ServerA) wurden als die wahren Werte gewählt, obwohl wir wussten, dass wir dadurch einige persistente Transaktionen verloren, die nicht als wichtig erachtet wurden.

Die Protokolldatei und die Position auf dem Slave wurden geändert.

CHANGE MASTER MASTER_LOG_FILE='bin-log.004713', MASTER_LOG_POS=0; -- on serverB

Die Slave-Replikation wurde auf dem passiven Master (Server B) neu gestartet, bis sie, wie bei den anderen Slaves, aufgrund von Verletzungen der Primärschlüsseleinschränkung fehlschlug.
```
 START SLAVE; -- on serverB
```
Slave-Replikation vom passiven Master (ServerB) zum aktiven Master (ServerA) gestoppt.
```
STOP SLAVE; -- on serverA
```

LÖSCHEN Sie die Zeilen auf dem Slave (Server B), die im Master auf Server A nicht vorhanden waren.

DELETE FROM SOME_TABLE WHERE ID IN (???,????); -- on serverB
SHOW MASTER STATUS\G; -- get the new master log position on serverB

Verschieben Sie die Slave-Exec-Position des aktiven Masters (ServerA), um diese Löschungen vom passiven Master (ServerB) zu überspringen.
```
CHANGE MASTER TO MASTER_LOG_POS=???; --on serverA; use the value just obtained from serverB
```
Starten Sie die Replikation sowohl auf dem aktiven Master (Server A) als auch auf dem passiven Master neu.
```
START SLAVE; -- on both machines. serverA does nothing and serverB starts catching up.
```

Question 2

Es hängt davon ab, wie wichtig es ist, dass die Slaves exakte Repliken des Masters sind. Ihre erste Option wird bis zu einem gewissen Grad funktionieren, aber den Slaves könnten durchaus Informationen des Masters fehlen. Wenn Sie damit leben können, weil die Daten flüchtig sind oder so, dann entscheiden Sie sich dafür. Wenn es wichtig ist, dass die Slaves richtige Repliken sind, dann ist die zweite Option wahrscheinlich Ihre einzige Wahl. Leider reagiert die MySQL-Replikation nicht freundlich auf unerwartete Unterbrechungen jeglicher Art. Ich habe festgestellt, dass diese Art von Problemen in meiner Replikationsarchitektur viel häufiger auftreten, als mir lieb ist.

Answer

Es hängt davon ab, wie wichtig es ist, dass die Slaves exakte Repliken des Masters sind. Ihre erste Option wird bis zu einem gewissen Grad funktionieren, aber den Slaves könnten durchaus Informationen des Masters fehlen. Wenn Sie damit leben können, weil die Daten flüchtig sind oder so, dann entscheiden Sie sich dafür. Wenn es wichtig ist, dass die Slaves richtige Repliken sind, dann ist die zweite Option wahrscheinlich Ihre einzige Wahl. Leider reagiert die MySQL-Replikation nicht freundlich auf unerwartete Unterbrechungen jeglicher Art. Ich habe festgestellt, dass diese Art von Problemen in meiner Replikationsarchitektur viel häufiger auftreten, als mir lieb ist.

MySQL-Replikationsprobleme nach einem Stromausfall

Antwort1

Antwort2

verwandte Informationen