Ubuntu 10.04 Server stürzt ab

Ubuntu 10.04 Server stürzt ab

Ich verwende Ubuntu 10.04 (x64) als Web-/MySQL-Server.

Der Server reagierte nicht mehr auf SSH, Ping, HTTP usw. und der Techniker mit physischem Zugriff auf die Maschine hat mir diesen Screenshot hier geschickt:

http://img442.imageshack.us/img442/389/img00062201012211332.jpg

vom angeschlossenen Monitor, bevor er neu gestartet hat (und die Situation ist behoben). Ich bin nicht sicher, in welchem ​​Protokoll diese Informationen gespeichert sind, da ich den Text nach dem Überprüfen der Protokolle nach dem Neustart nicht finden kann.

Kann mir jemand helfen, herauszufinden, was passiert ist, und sicherzustellen, dass es nicht noch einmal passiert?

Danke

Antwort1

Der Kernel Panic kann verschiedene Ursachen haben, im Normalfall liegt er entweder an einem Modulproblem (ein Treiber, der nicht zu Ihrer Hardware passt) oder an einem Hardwareproblem.

Wenn das Problem in Ihrem Fall nicht reproduzierbar ist, liegt es wahrscheinlicher an der Hardware.
Und es könnte am Speicher liegen (ein fehlerhafter Speicher lässt sich nicht immer leicht identifizieren).

Ich würde den Server booten und während des Grub-Bildschirms (direkt nach dem Booten) die Option "memtest86" wählen. Der Speichertest muss mehrere Tage lang kontinuierlich laufen.
Wenn nach 3 Tagen kein Fehler auftritt, ist der SpeicherVielleichtOK.

Antwort2

Wenn Sie keine weiteren Informationen haben (wie ring0 sagte, werden sie nicht irgendwo auf der Festplatte gespeichert), können Sie nichts anderes tun.

Wenn Sie proaktiv vorgehen möchten oder es zufällig noch ein paar Mal passiert, können Sie versuchen, mit LKCD einen Core Dump zu erfassen. http://lkcd.sourceforge.net/

Ich weiß nicht, wie viel RAM Sie haben, aber selbst ein paar Stunden lang Memtest86 auszuprobieren, könnte hilfreich sein. Wirklich seltene Fehler werden damit natürlich nicht erkannt.

Ich schlage außerdem vor, dass Sie kernel.panic=5 /etc/sysctl.conf hinzufügen. Dadurch wird der Server nach 5 Sekunden automatisch neu gestartet, wenn der Kernel erneut hängt.

Schließlich denke ich, dass Sie immer eine Art Lights-Out-Management haben sollten. Dann könnten Sie sich anmelden, die Nachricht kopieren und den Server selbst neu starten.

Antwort3

Ich habe solche Abstürze erlebt, wenn Server über einen längeren Zeitraum mit zu hoher Last/zu vielen Prozessen liefen. Um allgemein zu überprüfen, was auf Ihrem Computer passiert, empfehle ich, ein Überwachungsframework wie Munin auf Ihrem Server zu installieren – das erleichtert die Analyse, falls dies erneut passiert.

Antwort4

Das klingt vielleicht ein bisschen seltsam, aber ich hatte Probleme mit Ubuntu x64 auf einem Server, der ein 64-Bit-Server war. Ich hatte sehr oft dieselben Fehler und die darauffolgenden „Einfrieren“-Probleme. Ich habe versucht, Treiber zu entfernen, Treiber wieder hinzuzufügen, habe Stunden damit verbracht, nach Fehlern zu suchen, und nichts hat geholfen. Ich habe das Problem schließlich gelöst, indem ich eine 32-Bit-Version von Ubuntu installiert habe. Es hat funktioniert, ich brauchte keine 64-Bit-Version, also habe ich es so laufen lassen. Das ist keine gute Lösung, wenn Sie 64-Bit benötigen, aber es bietet Ihnen vielleicht eine Möglichkeit, ein wenig herumzuschnüffeln. Vielleicht können Sie den Server, auf dem Sie Ubuntu ausführen, nachschlagen und prüfen, ob es bekannte Kompatibilitätsprobleme damit gibt. Viel Glück.

verwandte Informationen