編集 2012/09/20

Question 1

私が理解している限り、あなたの問題は、それがdu他のファイルシステム（その一部はネットワークまたは SAN マウントであり、使用率をカウントするのに長い時間がかかる）に降りていることです。

ファイルシステムの使用率を監視しようとしているのであればdu、間違っている仕事のためのツール。あなたが欲しいものdf（出力を含めたので、あなたはそれを知っているようです）。

出力を解析すると、df実行する必要がある特定のファイルシステムをターゲットにして、どのディレクトリがすべてのスペースを消費しているかを判断するのに役立ちますdu(または、運が良ければ、満杯のファイルシステムには特定の責任者がいて、その人に自分で解決するように指示することができます)。どちらの場合でも、少なくともファイルシステムがいっぱいになる前にいっぱいになっていることがわかります (出力の解析も簡単になります)。

要するに、dfまず走り、そして必要ならより具体的な詳細を取得するには、使用率が (たとえば) 85% を超えていると特定された任意のduファイルシステムで実行します。df

スクリプトに移ると、あなたの(または) フラグduが尊重されない理由は、あなたが尋ねている質問のためです:-d-x

 # pwd   
 /
 # du * (. . .etc. . .)

--など、du以下にあるすべてのものを実行するように要求しています。 --は、要求したとおりに動作します（それぞれの使用方法を示します）。引数の 1 つがファイルシステムのルートである場合は、何をしているかわかっていると想定して、使用方法を示します。/du -x /bin /home /sbin /usr /tmp /varduduそれ最初に見つかったサブマウントまでのファイルシステム。

これは批判的にdu -x /（「サブマウントについて説明し/、サブマウントを無視する」）とは異なります。

スクリプトを修正するには*しないでください cd分析するディレクトリに、代わりに
du /path/to/full/disk | [whatever you want to feed the output through]

これ (またはあなたが得る他の提案) では、次の 2 つの主要な問題は解決されません。

監視システムはアドホックです
性器に問題が起こる前に対処したいなら本当に展開する必要がある適切な監視プラットフォーム経営陣にこのことに納得してもらうのが難しい場合は、適切な監視によってダウンタイムを回避できることを経営陣に思い出させてください。
あなたの環境は（あなたが正しく推測したように）めちゃくちゃです
再建する以外にここでできることはあまりない - それはあなたのSA としての仕事は、立ち上がって、システムを 1 つずつ削除し、管理可能な構造で再構築する必要がある理由について、非常に明確で大声でビジネスケースを作成することです。

何をすべきかについては、かなりよく理解されているようですが、質問がある場合は、ぜひ質問してください。私たちはできる限りお手伝いします (アーキテクチャについては対応できませんが、概念的な質問や「X監視ツールで何をすればよいですかY?」といった実用的な質問には回答できます)。

Answer

私が理解している限り、あなたの問題は、それがdu他のファイルシステム（その一部はネットワークまたは SAN マウントであり、使用率をカウントするのに長い時間がかかる）に降りていることです。

ファイルシステムの使用率を監視しようとしているのであればdu、間違っている仕事のためのツール。あなたが欲しいものdf（出力を含めたので、あなたはそれを知っているようです）。

出力を解析すると、df実行する必要がある特定のファイルシステムをターゲットにして、どのディレクトリがすべてのスペースを消費しているかを判断するのに役立ちますdu(または、運が良ければ、満杯のファイルシステムには特定の責任者がいて、その人に自分で解決するように指示することができます)。どちらの場合でも、少なくともファイルシステムがいっぱいになる前にいっぱいになっていることがわかります (出力の解析も簡単になります)。

要するに、dfまず走り、そして必要ならより具体的な詳細を取得するには、使用率が (たとえば) 85% を超えていると特定された任意のduファイルシステムで実行します。df

スクリプトに移ると、あなたの(または) フラグduが尊重されない理由は、あなたが尋ねている質問のためです:-d-x

 # pwd   
 /
 # du * (. . .etc. . .)

--など、du以下にあるすべてのものを実行するように要求しています。 --は、要求したとおりに動作します（それぞれの使用方法を示します）。引数の 1 つがファイルシステムのルートである場合は、何をしているかわかっていると想定して、使用方法を示します。/du -x /bin /home /sbin /usr /tmp /varduduそれ最初に見つかったサブマウントまでのファイルシステム。

これは批判的にdu -x /（「サブマウントについて説明し/、サブマウントを無視する」）とは異なります。

スクリプトを修正するには*しないでください cd分析するディレクトリに、代わりに
du /path/to/full/disk | [whatever you want to feed the output through]

これ (またはあなたが得る他の提案) では、次の 2 つの主要な問題は解決されません。

監視システムはアドホックです
性器に問題が起こる前に対処したいなら本当に展開する必要がある適切な監視プラットフォーム経営陣にこのことに納得してもらうのが難しい場合は、適切な監視によってダウンタイムを回避できることを経営陣に思い出させてください。
あなたの環境は（あなたが正しく推測したように）めちゃくちゃです
再建する以外にここでできることはあまりない - それはあなたのSA としての仕事は、立ち上がって、システムを 1 つずつ削除し、管理可能な構造で再構築する必要がある理由について、非常に明確で大声でビジネスケースを作成することです。

何をすべきかについては、かなりよく理解されているようですが、質問がある場合は、ぜひ質問してください。私たちはできる限りお手伝いします (アーキテクチャについては対応できませんが、概念的な質問や「X監視ツールで何をすればよいですかY?」といった実用的な質問には回答できます)。

Question 2

簡単な答え: インフラストラクチャ監視ツール (ZenOSS、Zabixx など) をインストールします。

何かカスタムのものを探している場合、毎回手動で管理するのではなく、マシンごとの奇妙な違いを処理するための何らかの抽象化レイヤーが必要になるかもしれません。

Answer

簡単な答え: インフラストラクチャ監視ツール (ZenOSS、Zabixx など) をインストールします。

何かカスタムのものを探している場合、毎回手動で管理するのではなく、マシンごとの奇妙な違いを処理するための何らかの抽象化レイヤーが必要になるかもしれません。

Question 3

私はよくこのことを勧めます。アドホックなディスク使用量の計算に私が推奨するツールはncdu ユーティリティ--exclude複数回指定できるフラグがあります。

パッケージ版もありますソラリス(CSWncdu)、またはソースからコンパイルすることもできます。これにより、作業が大幅に簡素化されます。

Answer

私はよくこのことを勧めます。アドホックなディスク使用量の計算に私が推奨するツールはncdu ユーティリティ--exclude複数回指定できるフラグがあります。

パッケージ版もありますソラリス(CSWncdu)、またはソースからコンパイルすることもできます。これにより、作業が大幅に簡素化されます。

Question 4

あなたが探しているのは次のようなものだと思いますNCDUこれにより、ディレクトリのトラバースを停止しながらも、ディスクが消費されている場所を見つけることができます。

他の回答と同様に、これはあなたが使用するツールです後監視システムが問題を検出しました。これは非対話的に使用したい種類のツールではありません。実際、これは ncurses ベースなので、そうすることは不便です。有能なシステム管理者であれば、あなたが説明したようなリソースを大量に消費する、寄せ集めの bash 怪物を防ぐために、検証済みのシンプルなツールをダウンロードすることを許可するでしょう。これは、その「禁止」ソフトウェアよりもはるかに多くのメモリと I/O を使用し、はるかに危険です。

Answer

あなたが探しているのは次のようなものだと思いますNCDUこれにより、ディレクトリのトラバースを停止しながらも、ディスクが消費されている場所を見つけることができます。

他の回答と同様に、これはあなたが使用するツールです後監視システムが問題を検出しました。これは非対話的に使用したい種類のツールではありません。実際、これは ncurses ベースなので、そうすることは不便です。有能なシステム管理者であれば、あなたが説明したようなリソースを大量に消費する、寄せ集めの bash 怪物を防ぐために、検証済みのシンプルなツールをダウンロードすることを許可するでしょう。これは、その「禁止」ソフトウェアよりもはるかに多くのメモリと I/O を使用し、はるかに危険です。

編集 2012/09/20

編集 2012/09/20

編集: コマンドは、それぞれ RHEL5 または Solaris 10 で du -x または du -d を適切に使用できるように更新されました。

Linux プラットフォームの例: xargs du -shx

Solaris プラットフォームの例: xargs du -shd

答え1

答え2

答え3

答え4

関連情報