Bearbeiten 20.09.2012

Question 1

Ihr Problem besteht, so wie ich es verstehe, darin, dass es duin andere Dateisysteme abdriftet (einige davon sind Netzwerk- oder SAN-Mounts, und das Zählen der Auslastung dauert lange).

Ich möchte respektvoll anmerken, dass, wenn Sie versuchen, die Dateisystemauslastung zu überwachen du, diefalschWerkzeug für die gewünschte Aufgabe df(Sie wissen es offensichtlich, da Sie die Ausgabe mit aufgenommen haben).

Durch das Parsen der Ausgabe dfkönnen Sie bestimmte Dateisysteme anvisieren, in denen Sie arbeiten sollten, duum zu ermitteln, welche Verzeichnisse Ihren gesamten Speicherplatz beanspruchen (oder wenn Sie Glück haben, gibt es für das gesamte Dateisystem eine bestimmte verantwortliche Partei, die Sie anweisen können, dies selbst herauszufinden). In beiden Fällen wissen Sie zumindest, dass ein Dateisystem voll wird, bevor es voll ist (und die Ausgabe ist einfacher zu parsen).

Kurz gesagt: dfErst laufen, dannwenn du musstFühren Sie es duauf jedem Dateisystem aus df, bei dem eine Auslastung von über (sagen wir) 85 % festgestellt wurde, um genauere Details zu erhalten.

Wenn wir uns Ihr Skript ansehen, liegt der Grund dafür du, dass Ihr -d(oder -x)-Flag nicht beachtet wird, in der Frage, die Sie stellen:

 # pwd   
 /
 # du * (. . .etc. . .)

Sie fordern, alles unter -- usw. duauszuführen , und tun dann genau das, was Sie gefragt haben (und geben Ihnen die Verwendung jedes dieser Dinge an). Wenn eines der Argumente zufällig ein Dateisystem-Root ist, wird davon ausgegangen, dass Sie wissen, was Sie tun, und die Verwendung von/du -x /bin /home /sbin /usr /tmp /varduduDasDateisystem bis zum ersten gefundenen Submount.

Das istkritischunterscheidet sich von du -x /(„Informieren Sie mich über /etwaige Untermounts und ignorieren Sie diese“).

So reparieren Sie Ihr Skript*nicht cdin das Verzeichnis, das Sie analysieren -- führen Sie stattdessen einfach
du /path/to/full/disk | [whatever you want to feed the output through]

Dies (oder jeder andere Vorschlag, den Sie erhalten) löst Ihre beiden Kernprobleme nicht:

Ihr Überwachungssystem ist ad hoc
Wenn Sie Probleme erkennen möchten, bevor sie Sie in die Genitalien beißen,Wirklichmüssen Sie einenanständige Überwachungsplattform. Wenn Sie Schwierigkeiten haben, Ihr Managementteam davon zu überzeugen, erinnern Sie es daran, dass Sie Ausfallzeiten durch eine ordnungsgemäße Überwachung vermeiden können.
Ihre Umgebung (wie Sie richtig vermutet haben) ist ein Chaos
Hier gibt es nicht viel zu tun, außer das Ding wieder aufzubauen - Es istdeinMeine Aufgabe als SA besteht darin, aufzustehen und sehr deutlich und lautstark darzulegen, warum die Systeme nach und nach abgebaut und mit einer verwaltbaren Struktur neu aufgebaut werden müssen.

Sie scheinen ganz gut zu wissen, was zu tun ist, aber wenn Sie Fragen haben, stellen Sie diese auf jeden Fall und wir werden versuchen, Ihnen so gut zu helfen, wie wir können (wir können Ihre Architektur nicht für Sie erstellen, aber wir können konzeptionelle Fragen oder praktische Dinge wie „Wie gehe ich Xmit dem Überwachungstool um Y?“ beantworten …

Answer

Ihr Problem besteht, so wie ich es verstehe, darin, dass es duin andere Dateisysteme abdriftet (einige davon sind Netzwerk- oder SAN-Mounts, und das Zählen der Auslastung dauert lange).

Ich möchte respektvoll anmerken, dass, wenn Sie versuchen, die Dateisystemauslastung zu überwachen du, diefalschWerkzeug für die gewünschte Aufgabe df(Sie wissen es offensichtlich, da Sie die Ausgabe mit aufgenommen haben).

Durch das Parsen der Ausgabe dfkönnen Sie bestimmte Dateisysteme anvisieren, in denen Sie arbeiten sollten, duum zu ermitteln, welche Verzeichnisse Ihren gesamten Speicherplatz beanspruchen (oder wenn Sie Glück haben, gibt es für das gesamte Dateisystem eine bestimmte verantwortliche Partei, die Sie anweisen können, dies selbst herauszufinden). In beiden Fällen wissen Sie zumindest, dass ein Dateisystem voll wird, bevor es voll ist (und die Ausgabe ist einfacher zu parsen).

Kurz gesagt: dfErst laufen, dannwenn du musstFühren Sie es duauf jedem Dateisystem aus df, bei dem eine Auslastung von über (sagen wir) 85 % festgestellt wurde, um genauere Details zu erhalten.

Wenn wir uns Ihr Skript ansehen, liegt der Grund dafür du, dass Ihr -d(oder -x)-Flag nicht beachtet wird, in der Frage, die Sie stellen:

 # pwd   
 /
 # du * (. . .etc. . .)

Sie fordern, alles unter -- usw. duauszuführen , und tun dann genau das, was Sie gefragt haben (und geben Ihnen die Verwendung jedes dieser Dinge an). Wenn eines der Argumente zufällig ein Dateisystem-Root ist, wird davon ausgegangen, dass Sie wissen, was Sie tun, und die Verwendung von/du -x /bin /home /sbin /usr /tmp /varduduDasDateisystem bis zum ersten gefundenen Submount.

Das istkritischunterscheidet sich von du -x /(„Informieren Sie mich über /etwaige Untermounts und ignorieren Sie diese“).

So reparieren Sie Ihr Skript*nicht cdin das Verzeichnis, das Sie analysieren -- führen Sie stattdessen einfach
du /path/to/full/disk | [whatever you want to feed the output through]

Dies (oder jeder andere Vorschlag, den Sie erhalten) löst Ihre beiden Kernprobleme nicht:

Ihr Überwachungssystem ist ad hoc
Wenn Sie Probleme erkennen möchten, bevor sie Sie in die Genitalien beißen,Wirklichmüssen Sie einenanständige Überwachungsplattform. Wenn Sie Schwierigkeiten haben, Ihr Managementteam davon zu überzeugen, erinnern Sie es daran, dass Sie Ausfallzeiten durch eine ordnungsgemäße Überwachung vermeiden können.
Ihre Umgebung (wie Sie richtig vermutet haben) ist ein Chaos
Hier gibt es nicht viel zu tun, außer das Ding wieder aufzubauen - Es istdeinMeine Aufgabe als SA besteht darin, aufzustehen und sehr deutlich und lautstark darzulegen, warum die Systeme nach und nach abgebaut und mit einer verwaltbaren Struktur neu aufgebaut werden müssen.

Sie scheinen ganz gut zu wissen, was zu tun ist, aber wenn Sie Fragen haben, stellen Sie diese auf jeden Fall und wir werden versuchen, Ihnen so gut zu helfen, wie wir können (wir können Ihre Architektur nicht für Sie erstellen, aber wir können konzeptionelle Fragen oder praktische Dinge wie „Wie gehe ich Xmit dem Überwachungstool um Y?“ beantworten …

Question 2

Einfache Antwort: Installieren Sie ein Tool zur Infrastrukturüberwachung (z. B. ZenOSS, Zabixx usw.).

Wenn Sie nach etwas Benutzerdefiniertem suchen, benötigen Sie vielleicht eine Art Abstraktionsschicht, um seltsame Unterschiede zwischen den Maschinen zu verarbeiten, anstatt dies jedes Mal manuell zu verwalten?

Answer

Einfache Antwort: Installieren Sie ein Tool zur Infrastrukturüberwachung (z. B. ZenOSS, Zabixx usw.).

Wenn Sie nach etwas Benutzerdefiniertem suchen, benötigen Sie vielleicht eine Art Abstraktionsschicht, um seltsame Unterschiede zwischen den Maschinen zu verarbeiten, anstatt dies jedes Mal manuell zu verwalten?

Question 3

Ich gebe diese Empfehlung oft ab. Das Tool, das ich für Ad-hoc-Berechnungen der Festplattennutzung empfehle, ist dasncdu-Dienstprogramm. Es gibt ein --excludeFlag, das mehrfach angegeben werden kann.

Es gibt verpackte Versionen fürSolaris(CSWncdu), oder Sie können es aus dem Quellcode kompilieren. Das vereinfacht vieles von dem, was Sie tun.

Answer

Ich gebe diese Empfehlung oft ab. Das Tool, das ich für Ad-hoc-Berechnungen der Festplattennutzung empfehle, ist dasncdu-Dienstprogramm. Es gibt ein --excludeFlag, das mehrfach angegeben werden kann.

Es gibt verpackte Versionen fürSolaris(CSWncdu), oder Sie können es aus dem Quellcode kompilieren. Das vereinfacht vieles von dem, was Sie tun.

Question 4

Ich glaube, was Sie suchen, ist so etwas wiencdu. Dadurch können Sie das Navigieren in Verzeichnissen verhindern und dennoch feststellen, wo die Festplatte belegt ist.

Ich schließe mich den anderen Antworten an und sage, dass dies das Werkzeug ist, das Sie verwendennachIhre Überwachungssysteme haben ein Problem erkannt – es ist nicht die Art von Tool, die Sie nicht interaktiv verwenden möchten. Da es auf Ncurses basiert, wäre dies tatsächlich ein Plackerei. Jeder Systemadministrator, der etwas auf sich hält, wird Ihnen erlauben, ein geprüftes und einfaches Tool herunterzuladen, um ressourcenhungrige, zusammengehackte Bash-Monstrositäten wie die von Ihnen beschriebene zu verhindern. Es wird viel mehr Speicher und viel mehr I/O verbrauchen und viel gefährlicher sein als diese „verbotene“ Software.

Answer

Ich glaube, was Sie suchen, ist so etwas wiencdu. Dadurch können Sie das Navigieren in Verzeichnissen verhindern und dennoch feststellen, wo die Festplatte belegt ist.

Ich schließe mich den anderen Antworten an und sage, dass dies das Werkzeug ist, das Sie verwendennachIhre Überwachungssysteme haben ein Problem erkannt – es ist nicht die Art von Tool, die Sie nicht interaktiv verwenden möchten. Da es auf Ncurses basiert, wäre dies tatsächlich ein Plackerei. Jeder Systemadministrator, der etwas auf sich hält, wird Ihnen erlauben, ein geprüftes und einfaches Tool herunterzuladen, um ressourcenhungrige, zusammengehackte Bash-Monstrositäten wie die von Ihnen beschriebene zu verhindern. Es wird viel mehr Speicher und viel mehr I/O verbrauchen und viel gefährlicher sein als diese „verbotene“ Software.

Bearbeiten 20.09.2012

Bearbeiten 20.09.2012

Bearbeiten: Der Befehl wurde aktualisiert, um du -x oder du -d unter RHEL5 bzw. Solaris 10 richtig zu nutzen.

Beispiel für die Linux-Plattform: xargs du -shx

Beispiel für die Solaris-Plattform: xargs du -shd

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen