Systemausfall vorhersagen

Systemausfall vorhersagen

Gibt es eine Möglichkeit, den Ausfall eines Servers durch die Messung von Systemparametern wie CPU-Auslastung, Speicherauslastung usw. vorherzusagen?

Der Fehler kann verschiedene Gründe haben.

Meine Frage war schlecht formuliert. Daher diese Bearbeitung

BEARBEITEN

Können wir anhand der gesammelten Daten (Systemparameter) eine Art maschinelles Lernen nutzen, um vorherzusagen, ob der Server ausfallen wird?

Wir hätten Protokolle über die Zustände des Servers, sowohl wenn er aktiv war als auch wenn er ausgefallen ist

Antwort1

Kaufen Sie sich einen Server und Komponenten, die sich regelmäßig selbst testen und Warnungen vor einem Ausfall melden. Die Fähigkeit der Server, dies zu tun, macht den Unterschied zwischen den Top-Anbietern (HP, IBM, Dell) und kleineren Marken aus – das kostet natürlich mehr, aber für manche lohnt es sich.

Beispielsweise verfügt der HP DL380 Gen9-Server buchstäblich über Hunderte von Sensoren rund um das Gerät und seine Komponenten, die zusammen diese „Vorausfallwarnungen“ liefern, wenn möglich. Dies funktioniert tatsächlich routinemäßig und ihre Supportverträge, die ebenfalls nicht billig sind, ermöglichen den Austausch von Hardware auf der Grundlage dieser Informationen – Sie können eine Festplatte/einen Controller/einen Speicher/eine CPU/ein Netzteil usw. austauschen.VORSein Versagen wirkt sich auf Sie aus.

Zusammenfassend lässt sich also sagen: Wenn Verfügbarkeit für Sie entscheidend ist, kaufen Sie Server, die dies können, und konfigurieren Sie sie so, dass diese Informationen gemeldet werden, sobald sie eintreffen.

Antwort2

Nein, zumindest nicht im Allgemeinen, da sich verschiedene Systeme in fast jedem Aspekt, den Sie überprüfen könnten, so stark unterscheiden. Auf meinen Webservern wäre ich beispielsweise besorgt, wenn sie für mehr als eine sehr kurze Zeit 100 % CPU-Auslastung erreichen würden, aber auf den Rechenknoten könnte eine CPU-Auslastung von unter 100 % ein Grund zur Sorge sein.

Sie könnten versuchen, ein Überwachungssystem (z. B. Nagios/Icinga) zu installieren und Schwellenwertparameter festzulegen, die für Ihren speziellen Anwendungsfall sinnvoll sind. Sie müssen jedoch lange und gründlich überlegen, welche Parameter Sie überprüfen und welche Schwellenwerte Sie für Ihre speziellen Umstände festlegen müssen.

verwandte Informationen