
Wir haben mehrere LAMP-Server, auf denen jeweils ein spezielles Skript ausgeführt wird, das wir geschrieben haben, um über verschiedene Systemmetriken zu berichten. Der Bericht wird täglich ausgeführt und die Idee besteht darin, einen schnellen Durchlauf durchführen und mögliche Probleme im System erkennen zu können.
Auf jedem LAMP-Server läuft RedHat Enterprise und er hostet jeweils 40–50 (und es werden immer mehr) öffentlich zugängliche Websites (eine Mischung aus HTML, benutzerdefinierten PHP- und Drupal-Sites).
Folgendes enthält das Skript derzeit:
- Serverauslastung und angemeldete Benutzer
- Letzte 10 Anmeldungen und Zeiten
- Festplattennutzung
- Letzte 10 Zeilen aus verschiedenen Protokollen (Qmail, MySQL, Secure, Apache-Fehler, Paket)
- Benutzername, Port und letzte Anmeldezeit für jedes Konto
- oberer Abfluss
Der Bericht ist bereits lang, daher bin ich an größtmöglicher Kürze interessiert.
Sind Ihnen weitere wichtige Kennzahlen für die Aufnahme in ein solches Skript eingefallen? Würden Sie welche aus der Liste streichen?
Danke, Team.
J
Antwort1
Ich würde Tests durchführen, um sicherzustellen, dass Ihre Umgebung in Ordnung ist. Testen Sie, ob PHP richtig läuft (schreiben Sie ein einfaches PHP-Skript, das etwas ausgibt, rufen Sie es ab, stellen Sie sicher, dass Sie das Erwartete erhalten haben), Ihre Datenbank (stellen Sie einfach eine Verbindung her und stellen Sie sicher, dass Sie Datenbanken sehen können) usw.
Wenn Sie SSL darauf verwenden, überprüfen Sie das Zertifikat außerdem auf Ablauf, unerwartete Änderungen usw.
Antwort2
Ich empfehle die Verwendung eines automatisierten Erfassungstools wieKakteendas im Laufe der Zeit verschiedene Kennzahlen sammelt und darüber berichtet. So können Sie Trends leicht erkennen und für die Zukunft planen. Es gibt ein ausgezeichnetes Buch von John Allspaw mit dem TitelDie Kunst der Kapazitätsplanungdas sehr ausführlich auf dieses Thema eingeht. Ich kann es jedem wärmstens empfehlen, der Metriken auf Servern verfolgen muss.
Antwort3
Ich rate Ihnen, solche Dinge nicht routinemäßig zu melden. Sie werden mit Informationen überschwemmt und die menschliche Natur führt dazu, dass Sie ein Problem, wenn es auftritt, möglicherweise übersehen.
Melden Sie stattdessen nur, wenn eine dieser Variablen abnormal ist. Vielleicht sogar noch häufiger am Tag. Sie könnten ein Überwachungs- und Grafiksystem wie Cacti verwenden, das Sie auf solche Änderungen aufmerksam macht und historische Daten für zukünftige Referenzzwecke speichert.
Antwort4
Sie möchten wirklich eine ständige Überwachung haben. Wir verwenden Nagios, um jeden unserer Webserver mehrmals pro Minute zu überprüfen und sicherzustellen, dass sie noch funktionieren. Wir überwachen auch unsere Datenbanken und alles andere, was uns einfällt. Mit der Zeit werden Sie Ausfälle haben und Dinge entdecken, die Sie hätten überwachen sollen.
Die andere Seite der Überwachung ist eine Art grafische Darstellung. Wir verwenden Munin, aber Kakteen oder Ganglien sind gängige Lösungen. Die grafische Darstellung ist von unschätzbarem Wert, um Trends in Ihrem System zu erkennen.