Was kann einen Kernel-Out_of_Memory-Fehler verursachen?

Question 1

Überprüfen Sie die Protokollnachrichten auf Hinweise zum Kernel-Out-of-Memory-Killer oder OOM killeddie Ausgabe von dmesg. Dies kann Hinweise darauf geben, welche Prozesse das Ziel des OOM-Killers waren. Sehen Sie sich auch Folgendes an:

http://lwn.net/Articles/317814/

Und

http://linux-mm.org/OOM_Killer

Was macht dieses System? Erschöpfen Sie gleichzeitig den Swap? Basierend auf Ihrem externen Link, der den Absturz beschreibt, sieht es so aus, als ob rsyslogd das Problem ist. Dies könnte eine Situation sein, in der ein regelmäßiger Neustart der App nützlich wäre.

Answer

Überprüfen Sie die Protokollnachrichten auf Hinweise zum Kernel-Out-of-Memory-Killer oder OOM killeddie Ausgabe von dmesg. Dies kann Hinweise darauf geben, welche Prozesse das Ziel des OOM-Killers waren. Sehen Sie sich auch Folgendes an:

http://lwn.net/Articles/317814/

Und

http://linux-mm.org/OOM_Killer

Was macht dieses System? Erschöpfen Sie gleichzeitig den Swap? Basierend auf Ihrem externen Link, der den Absturz beschreibt, sieht es so aus, als ob rsyslogd das Problem ist. Dies könnte eine Situation sein, in der ein regelmäßiger Neustart der App nützlich wäre.

Question 2

2.6.18 ist ein sehr alter Kernel. Ich bin auf Probleme gestoßen, bei denen bestimmte Bedingungen Endlosschleifen im Kernel auslösen können, was alles von Speichererschöpfung bis hin zur vollständigen Ausschöpfung der E/A-Bandbreite zur Folge hat, wenn dieselben Daten in einer Endlosschleife auf die Festplatte geschrieben werden (was zwar Lastspitzen, aber eine normale CPU-Auslastung verursacht).

Diese Fehler werden normalerweise bald nach ihrer Meldung behoben, sodass sich ein Kernel-Upgrade problemlos durchführen lässt. Außerdem erhält man bei einem Kernel-Upgrade einige kostenlose Sicherheitsfixes :-)

Answer

2.6.18 ist ein sehr alter Kernel. Ich bin auf Probleme gestoßen, bei denen bestimmte Bedingungen Endlosschleifen im Kernel auslösen können, was alles von Speichererschöpfung bis hin zur vollständigen Ausschöpfung der E/A-Bandbreite zur Folge hat, wenn dieselben Daten in einer Endlosschleife auf die Festplatte geschrieben werden (was zwar Lastspitzen, aber eine normale CPU-Auslastung verursacht).

Diese Fehler werden normalerweise bald nach ihrer Meldung behoben, sodass sich ein Kernel-Upgrade problemlos durchführen lässt. Außerdem erhält man bei einem Kernel-Upgrade einige kostenlose Sicherheitsfixes :-)

Question 3

Vergessen Sie außerdem nicht, dass Cacti und ähnliche Programme Diagramme mit einer bestimmten Auflösung erstellen (collectd hat die Standardauflösung 5 s, Cacti, glaube ich, 30 s), sodass ein Zeitraum von 30–60 Sekunden nicht unbedingt in Ihren Diagrammen angezeigt wird. Wenn das System völlig überlastet ist, wirkt sich dies auch auf den Daemon zur Datenerfassung aus.

Möglicherweise finden Sie weitere nützliche Informationen in Ihren Protokolldateien, sei es in den allgemeinen Dateien /var/log/messages oder in den dienstspezifischen Dateien /var/log/apache2/error.log.

Wenn das nicht möglich ist, empfehle ich Ihnen, Ihre Dienste durchzugehen (in Ihrem Protokollauszug oben ist mir Apache2 aufgefallen) und zu überprüfen, ob sie eine Speichererschöpfung auf Ihrem Server verursachen können. (Beispiel: Die Standardkonfiguration von Apache mit mod_prefork und PHP sollte in der Lage sein, Ihr System zum Stillstand zu bringen.)

Answer

Vergessen Sie außerdem nicht, dass Cacti und ähnliche Programme Diagramme mit einer bestimmten Auflösung erstellen (collectd hat die Standardauflösung 5 s, Cacti, glaube ich, 30 s), sodass ein Zeitraum von 30–60 Sekunden nicht unbedingt in Ihren Diagrammen angezeigt wird. Wenn das System völlig überlastet ist, wirkt sich dies auch auf den Daemon zur Datenerfassung aus.

Möglicherweise finden Sie weitere nützliche Informationen in Ihren Protokolldateien, sei es in den allgemeinen Dateien /var/log/messages oder in den dienstspezifischen Dateien /var/log/apache2/error.log.

Wenn das nicht möglich ist, empfehle ich Ihnen, Ihre Dienste durchzugehen (in Ihrem Protokollauszug oben ist mir Apache2 aufgefallen) und zu überprüfen, ob sie eine Speichererschöpfung auf Ihrem Server verursachen können. (Beispiel: Die Standardkonfiguration von Apache mit mod_prefork und PHP sollte in der Lage sein, Ihr System zum Stillstand zu bringen.)

Was kann einen Kernel-Out_of_Memory-Fehler verursachen?

Aktualisieren:

Aktualisierung 2:

Antwort1

Antwort2

Antwort3

verwandte Informationen