Linux: Systemanalysetool

Linux: Systemanalysetool

Ich habe einen Server, der mehrere Aufgaben über den eingehenden Datenverkehr ausführt.
In letzter Zeit stottert der Server. Wenn das System abstürzt, startet es neu – das lässt mir nur wenige aussagekräftige Informationen über die Pathologie der Störung (das ist definitiv kein heftiger Absturz).
Welches Tool hat Ihnen Ihrer Erfahrung nach dabei geholfen, aussagekräftige Daten über eine Systemstörung zu erhalten?

Dies könnte der Speicherverbrauch, „ps“, „top“ oder ein beliebiger anderer Parameter sein.
Bedenken Sie, dass ein Skript, das einfach ab und zu mehrere lange Befehle ausgibt (ps -a), sehr viel Speicher beanspruchen und schwer zu analysieren sein kann.

Antwort1

Installieren Sie SAR. Es stellt standardmäßig alle 10 Minuten einen Daten-Snapshot bereit, Sie können die Informationsrate jedoch mithilfe des Cron-Jobs ändern.

Es werden zahlreiche nützliche Daten bereitgestellt, beispielsweise zu Arbeitsspeicher, CPU-Auslastung und Festplatten-E/A-Statistiken.

Antwort2

Sie benötigen eine historische Analyse der gängigsten Parameter des Systems. Ich würde MUNIN empfehlen, das über das Internet Diagramme der gängigsten Systemressourcen bereitstellt, die Sie ständig überwachen können, um zu sehen, welcher Prozess/welcher Dienst die Ressourcen verstopft und welche Ressource.

Danach würde ich empfehlen, die Systemprotokolldateien mit tail -f zu überprüfen, um herauszufinden, was dieses Problem verursacht.

Antwort3

Manchmal finde ich SAR etwas unzureichend. Ich bin auf Fälle gestoßen, in denen Sie ein vollständiges Bild davon benötigen, was in Ihrem System vor sich geht. Befehle wie top, ps, vmstat, netstat, iostat, iotop sind dann praktisch. Normalerweise logge ich diese Befehle in eine Datei aus. Wenn Sie nur begrenzt Platz haben, gibt es einen Dienst namensSeaLiondas alle oben genannten Befehle ausführt und in der Cloud speichert. Sie können über Ihren Browser auf diese Daten zugreifen. Bildbeschreibung hier eingeben

Außerdem möchte ich andere Dienste erwähnen, wie Nagios, Munin, New Relic, Server densitydas ebenfalls Statistiken von Ihrem Computer sammelt, die beim Debuggen eines Problems nützlich sein könnten.

verwandte Informationen