Übermäßige Anzahl von schlafenden Prozessen in CentOS – wie kann man das diagnostizieren?

Übermäßige Anzahl von schlafenden Prozessen in CentOS – wie kann man das diagnostizieren?

Ich habe eine große Anzahl ruhender Prozesse, etwa 600, von denen die meisten Apache-Prozesse sind.

Soll ich alle diese schlafenden Prozesse beenden oder führt das zu einem vollständigen Absturz von Apache?

Warum schlafen diese Prozesse überhaupt?

Auf dem Server läuft CentOS 6 mit Apache 2.2.

Antwort1

Durch das Beenden aller schlafenden Prozesse Ihres Systems wird kein Problem gelöst, schon gar nicht das, das Sie haben.


Dabei ist es deutlich besser, strukturiert und methodisch vorzugehen, als wild umherzuflattern.

Persönlich finde ichWissenschaftliche Methode(andere nennen esetwas anderes) ein wunderbares Werkzeug, das man bei der Problemdiagnose aus der Werkzeugkiste der Systemadministration hervorholen kann.

  1. Welches eigentliche Problem versuchen Sie zu lösen?

Ein Dienst reagiert nicht mehr. 1

  1. Jetzt wissen wir also, welches Problem wir eigentlich lösen wollen und haben eine Richtung vor uns. Lassen Sie uns einige Informationen sammeln, die uns bei der Lösungsfindung helfen.

    • Ist das Problem zeitbezogen? Tritt es regelmäßig oder zufällig auf?
    • Überprüfen Sie alle Ihre Protokolle, nicht nur die Protokolle der einzelnen Dienste, da das Problem auch durch etwas anderes verursacht werden kann. Protokolleinträge haben im Allgemeinen Zeitstempel. Dies hilft Ihnen dabei, Ereignisse über mehrere Anwendungen und Dienste hinweg zu korrelieren. Verwenden Sie diese. Erhöhen Sie bei Bedarf auch die Ausführlichkeit der Protokolle.
    • Beobachten Sie, was Ihr System tut. Verwenden Sie Tools wie top, vmstat, iostat, sar, ps, tcpdump oder sogarÜberwachungssysteme.

  2. Analysieren Sie die gesammelten Informationen. Was passiert eigentlich auf dem System, wenn der Dienst nicht mehr reagiert? Wie ist der Zustand der Systemressourcen?

  3. Ergreifen Sie geeignete Maßnahmen zur Behebung. Hoffentlich ist es ziemlich offensichtlich, was los ist: Ihnen geht der Speicher aus und der OOM-Killer kommt zum Einsatz, Ihre Swap-Aktivität ist zu hoch, Ihre Ausführungswarteschlange ist zu lang, Sie sind iobound usw. Wenn es nicht offensichtlich ist, erfassen Sie wahrscheinlich nicht die richtigen Daten – Sie wissen, was zu tun ist. Gehen Sie zurück zu 2.

  4. Beobachten Sie, was die unter 4. eingeführten Änderungen bewirken.

  5. Haben die Änderungen das Problem behoben? Ist es besser? Ist es schlechter? Gibt es keinen Unterschied? Wie Sie von hier aus weitermachen, hängt davon ab, was Sie finden. Möglicherweise müssen Sie zu 2. zurückkehren und relevantere Daten sammeln oder 3. die vorhandenen Daten erneut analysieren oder 4. weil Sie eine Reihe potenzieller Lösungen identifiziert haben.

  6. Dokumentieren Sie Ihre Ergebnisse und die vorgenommenen Änderungen.

  7. Geh zurück ins Bett/von der Arbeit nach Hause/in die Kneipe.

1 Dies kann jedoch alles Mögliche sein: „Mein Server ist langsam“, „Mein Server verwendet zu viel Speicher“ …

verwandte Informationen