Server-Absturzdiagnose ... Gibt es Programme im Stil eines „Black Box Recorders“?

Question 1

Dies sind die Zeiten, zu denen cron.daily-Jobs geplant sind. Ich würde also in /etc/cron.daily oder weekly oder monthly nachsehen, da die ersten Verdächtigen

Sie können installieren, auf dem alle 10 Minuten ein Snapshot der Prozesse aufgezeichnet wird

Alternativ können Sie psacct installieren und accton und lastcomm verwenden, um zu sehen, was ausgeführt wurde

das Einschalten von Auditing ist auch eine Option, siehe auditd(8)

Answer

Dies sind die Zeiten, zu denen cron.daily-Jobs geplant sind. Ich würde also in /etc/cron.daily oder weekly oder monthly nachsehen, da die ersten Verdächtigen

Sie können installieren, auf dem alle 10 Minuten ein Snapshot der Prozesse aufgezeichnet wird

Alternativ können Sie psacct installieren und accton und lastcomm verwenden, um zu sehen, was ausgeführt wurde

das Einschalten von Auditing ist auch eine Option, siehe auditd(8)

Question 2

Sie können Core Dumps aktivieren, die den Systemspeicher in eine Datei kopieren, wenn ein Server abstürzt.

Das nächste Problem besteht darin, was mit der Coredump-Datei zu tun ist. Wenn Sie jemanden kennen, der sich mit GDB auskennt, kann er vielleicht etwas dagegen tun. Oder Sie können den Befehl „Strings“ verwenden, um den gesamten Text aus der Coredump-Datei zu löschen, und vielleicht finden Sie etwas.

Answer

Sie können Core Dumps aktivieren, die den Systemspeicher in eine Datei kopieren, wenn ein Server abstürzt.

Das nächste Problem besteht darin, was mit der Coredump-Datei zu tun ist. Wenn Sie jemanden kennen, der sich mit GDB auskennt, kann er vielleicht etwas dagegen tun. Oder Sie können den Befehl „Strings“ verwenden, um den gesamten Text aus der Coredump-Datei zu löschen, und vielleicht finden Sie etwas.

Question 3

Melden Sie sich auf einer anderen Box an, die über eine gute Verbindung verfügt, führen Sie „screen“ aus, melden Sie sich per SSH beim Server an und verfolgen Sie kern.log, daemon.log, syslog und Meldungen in den einzelnen Bildschirmfenstern. (Strg-A, C zum Erstellen eines neuen Fensters, Strg-A, D zum Trennen, screen -r zum Fortsetzen)

Wenn der Server erneut abstürzt, sollten Sie das Ende der Protokolle in Ihrer Bildschirmsitzung haben, auch wenn diese beim Absturz der Maschine nicht ordnungsgemäß auf die Festplatte geschrieben wurden.

Wenn Sie einen Kernel Panic oder Oops vermuten

kernel.panic=5 kernel.panic_on_oops=5

in Ihrer sysctl.conf oder einer gleichwertigen Datei wartet 5 Sekunden, ermöglicht möglicherweise das Leeren der Laufwerke und führt dann einen Neustart durch.

Answer

Melden Sie sich auf einer anderen Box an, die über eine gute Verbindung verfügt, führen Sie „screen“ aus, melden Sie sich per SSH beim Server an und verfolgen Sie kern.log, daemon.log, syslog und Meldungen in den einzelnen Bildschirmfenstern. (Strg-A, C zum Erstellen eines neuen Fensters, Strg-A, D zum Trennen, screen -r zum Fortsetzen)

Wenn der Server erneut abstürzt, sollten Sie das Ende der Protokolle in Ihrer Bildschirmsitzung haben, auch wenn diese beim Absturz der Maschine nicht ordnungsgemäß auf die Festplatte geschrieben wurden.

Wenn Sie einen Kernel Panic oder Oops vermuten

kernel.panic=5 kernel.panic_on_oops=5

in Ihrer sysctl.conf oder einer gleichwertigen Datei wartet 5 Sekunden, ermöglicht möglicherweise das Leeren der Laufwerke und führt dann einen Neustart durch.

Server-Absturzdiagnose ... Gibt es Programme im Stil eines „Black Box Recorders“?

Antwort1

Antwort2

Antwort3

verwandte Informationen