Warum wird MongoDB nicht automatisch neu gestartet?

Question 1

Bei einem unerwarteten Herunterfahren ist ein Eingreifen des Administrators auf jeden Fall dringend zu empfehlen. Sie können die Dienstvorgabe für Ihre Bereitstellungen jedoch jederzeit ändern.

Wenn der Grund für mongoddas Herunterfahren eines Prozesses eine Invariante ist, die nicht ohne manuelles Eingreifen behoben werden kann (z. B. zu wenig Speicherplatz oder beschädigte Datendateien), sind automatische Neustarts nicht hilfreich und könnten die Situation möglicherweise verschlimmern. Im Allgemeinen mongodsollte ein Prozess nicht bei behebbaren Fehlern heruntergefahren werden. Die MongoDBServer-Ausnahmearchitekturunterscheidet zwischen schwerwiegenden Fehlern pro Vorgang und solchen, die für den gesamten Prozess schwerwiegend sind. Prozessschwerwiegende Fehler sind Situationen, in denen die Fortsetzung zu schwerwiegenden Folgen wie Datenverlust oder beschädigten Daten auf der Festplatte führen kann. Ein vom Benutzer oder Betriebssystem initiiertes Signal zum Beenden des Prozesses (z. B. derOut-of-Memory, auch bekannt als OOM-Killerunter Linux) führt ebenfalls mongodzum Herunterfahren.

Ein Beispielfehler, der in den Kommentaren erwähnt wurde, war ein Indexaufbau, der auf einigen Sekundärservern mit einer älteren Version von MongoDB einen Segmentierungsfehler verursachte. Bei automatischen Dienstneustarts könnte dieses Szenario möglicherweise zu einer Endlosschleife führen, in der ein Sekundärserver abstürzt, neu startet, den Indexaufbau fortsetzt, auf denselben Zustand stößt und neu startet … nur um einen zum Scheitern verurteilten Indexaufbau fortzusetzen. Während diese Neustartschleife läuft, könnte die zeitweise Verfügbarkeit des Sekundärservers Clients beeinträchtigen, die sekundäre Leseeinstellungen oder andere Mitglieder des Replikatsatzes verwenden (z. B. wiederholtes Suchen in einem Upstream-Oplog, um die Synchronisierung fortzusetzen).

Als Systemadministrator würde ich lieber die MongoDB-Protokolle überprüfen und versuchen, herauszufinden, warum der Prozess beendet wurde, damit die Grundursache behoben werden kann. Im Idealfall verfügt eine Bereitstellung über ausreichendFehlertoleranzum mit der Nichtverfügbarkeit von Mitgliedern klarzukommen, sodass Zeit bleibt, die Situation zu untersuchen und zu beheben.

Je nach Art des Problems und der Bereitstellung (Standalone, Replikat-Set oder Sharded-Cluster) möchte ich möglicherweise auch eine Sicherungskopie der Datendateien erstellen, bevor ich eine automatische oder manuelle Wiederherstellung versuche. Wenn beispielsweise nach einem unsauberen Herunterfahren neu gestartet wird, mongodgibt es eine anfängliche Wiederherstellungsphase, in der ausstehende Journaleinträge angewendet und Speicher-Engine-Prüfungen wie die Integrität der Datendateien ausgeführt werden dbPath. Bei einem Standalone-Server wäre es ratsam, vor Wiederherstellungs-/Reparaturversuchen eine Kopie der unveränderten Datendateien zu erstellen. Bei einer Bereitstellung mit Replikat-Set sind die Daten bereits auf einem anderen Mitglied des Replikat-Sets dupliziert. Wenn die Standardwiederherstellung also nicht erfolgreich ist, würde ichdieses Mitglied erneut synchronisierenanstatt eine Reparatur zu versuchen.

Answer

Bei einem unerwarteten Herunterfahren ist ein Eingreifen des Administrators auf jeden Fall dringend zu empfehlen. Sie können die Dienstvorgabe für Ihre Bereitstellungen jedoch jederzeit ändern.

Wenn der Grund für mongoddas Herunterfahren eines Prozesses eine Invariante ist, die nicht ohne manuelles Eingreifen behoben werden kann (z. B. zu wenig Speicherplatz oder beschädigte Datendateien), sind automatische Neustarts nicht hilfreich und könnten die Situation möglicherweise verschlimmern. Im Allgemeinen mongodsollte ein Prozess nicht bei behebbaren Fehlern heruntergefahren werden. Die MongoDBServer-Ausnahmearchitekturunterscheidet zwischen schwerwiegenden Fehlern pro Vorgang und solchen, die für den gesamten Prozess schwerwiegend sind. Prozessschwerwiegende Fehler sind Situationen, in denen die Fortsetzung zu schwerwiegenden Folgen wie Datenverlust oder beschädigten Daten auf der Festplatte führen kann. Ein vom Benutzer oder Betriebssystem initiiertes Signal zum Beenden des Prozesses (z. B. derOut-of-Memory, auch bekannt als OOM-Killerunter Linux) führt ebenfalls mongodzum Herunterfahren.

Ein Beispielfehler, der in den Kommentaren erwähnt wurde, war ein Indexaufbau, der auf einigen Sekundärservern mit einer älteren Version von MongoDB einen Segmentierungsfehler verursachte. Bei automatischen Dienstneustarts könnte dieses Szenario möglicherweise zu einer Endlosschleife führen, in der ein Sekundärserver abstürzt, neu startet, den Indexaufbau fortsetzt, auf denselben Zustand stößt und neu startet … nur um einen zum Scheitern verurteilten Indexaufbau fortzusetzen. Während diese Neustartschleife läuft, könnte die zeitweise Verfügbarkeit des Sekundärservers Clients beeinträchtigen, die sekundäre Leseeinstellungen oder andere Mitglieder des Replikatsatzes verwenden (z. B. wiederholtes Suchen in einem Upstream-Oplog, um die Synchronisierung fortzusetzen).

Als Systemadministrator würde ich lieber die MongoDB-Protokolle überprüfen und versuchen, herauszufinden, warum der Prozess beendet wurde, damit die Grundursache behoben werden kann. Im Idealfall verfügt eine Bereitstellung über ausreichendFehlertoleranzum mit der Nichtverfügbarkeit von Mitgliedern klarzukommen, sodass Zeit bleibt, die Situation zu untersuchen und zu beheben.

Je nach Art des Problems und der Bereitstellung (Standalone, Replikat-Set oder Sharded-Cluster) möchte ich möglicherweise auch eine Sicherungskopie der Datendateien erstellen, bevor ich eine automatische oder manuelle Wiederherstellung versuche. Wenn beispielsweise nach einem unsauberen Herunterfahren neu gestartet wird, mongodgibt es eine anfängliche Wiederherstellungsphase, in der ausstehende Journaleinträge angewendet und Speicher-Engine-Prüfungen wie die Integrität der Datendateien ausgeführt werden dbPath. Bei einem Standalone-Server wäre es ratsam, vor Wiederherstellungs-/Reparaturversuchen eine Kopie der unveränderten Datendateien zu erstellen. Bei einer Bereitstellung mit Replikat-Set sind die Daten bereits auf einem anderen Mitglied des Replikat-Sets dupliziert. Wenn die Standardwiederherstellung also nicht erfolgreich ist, würde ichdieses Mitglied erneut synchronisierenanstatt eine Reparatur zu versuchen.

Question 2

Wenn Sie systemd verwenden, sollte Restart=alwaysin diesem [Service]Abschnitt ein Neustart des Dienstes nach einem Absturz zugelassen werden.

Answer

Wenn Sie systemd verwenden, sollte Restart=alwaysin diesem [Service]Abschnitt ein Neustart des Dienstes nach einem Absturz zugelassen werden.

Question 3

Wenn Ihnen eine hohe Verfügbarkeit wirklich wichtig ist, würden Sie ein Replikatset ausführen und mit dem Ausfall eines oder mehrerer Knoten umgehen können.

Nachdem ich persönlich fünf Jahre lang eine große, geteilte MongoDB-Bereitstellung in der Produktion verwaltet habe, würde ich es vorziehen, wenn die Instanzen NICHT automatisch neu gestartet würden, da ich alle Probleme untersuchen möchte, bevor sie wieder in die Rotation im Replikatsatz aufgenommen werden.

https://docs.mongodb.com/manual/core/replica-set-high-availability/

Answer

Wenn Ihnen eine hohe Verfügbarkeit wirklich wichtig ist, würden Sie ein Replikatset ausführen und mit dem Ausfall eines oder mehrerer Knoten umgehen können.

Nachdem ich persönlich fünf Jahre lang eine große, geteilte MongoDB-Bereitstellung in der Produktion verwaltet habe, würde ich es vorziehen, wenn die Instanzen NICHT automatisch neu gestartet würden, da ich alle Probleme untersuchen möchte, bevor sie wieder in die Rotation im Replikatsatz aufgenommen werden.

https://docs.mongodb.com/manual/core/replica-set-high-availability/

Warum wird MongoDB nicht automatisch neu gestartet?

Antwort1

Antwort2

Antwort3

verwandte Informationen