Редактировать 20.09.2012

Question 1

Насколько я понимаю, ваша проблема заключается в том, что она duраспространяется на другие файловые системы (некоторые из которых монтируются в сети или SAN и требуют много времени для подсчета использования).

Я с уважением заявляю, что если вы пытаетесь отслеживать использование файловой системыdu ,неправильныйинструмент для работы. Вы хотите df(о чем вы, по-видимому, знаете, поскольку включили его вывод).

Анализ вывода dfможет помочь вам определить конкретные файловые системы, в которых вы должны работать, duчтобы определить, какие каталоги пожирают все ваше пространство (или, если вам повезет, у полной файловой системы есть определенная ответственная сторона, которой вы можете поручить разобраться в этом самостоятельно). В любом случае вы по крайней мере будете знать, что файловая система заполняется, прежде чем она заполнится (и вывод будет проще анализировать).

Короче говоря: беги.df сначала беги, потомесли вам нужнозапустите duлюбую файловую систему, dfкоторая, как определено, имеет загрузку более (скажем) 85%, чтобы получить более конкретные данные.

Переходя к вашему сценарию, причина duнеуважения к вашему -d(или -x) флагу заключается в вопросе, который вы задаете:

 # pwd   
 /
 # du * (. . .etc. . .)

Вы просите duзапустить все под /-- du -x /bin /home /sbin /usr /tmp /varи т. д. -- duзатем делает именно то, что вы просили (предоставляя вам использование каждой из этих вещей. Если один из аргументов является корнем файловой системы, duпредполагается, что вы знаете, что делаете, и даете использованиечтофайловую систему до первого найденного подмонтированного раздела.

Этокритическиотличается от du -x /(«Расскажите мне о /дополнительных креплениях и игнорируйте их»).

Чтобы исправить ваш сценарий*не cdв каталог, который вы анализируете — вместо этого просто запустите
du /path/to/full/disk | [whatever you want to feed the output through]

Это (или любое другое предложение, которое вы можете получить) не решит ваши две основные проблемы:

Ваша система мониторинга является специальной
Если вы хотите обнаружить проблемы до того, как они укусят вас за гениталии, вамДействительнонеобходимо развернутьдостойная платформа мониторинга. Если у вас возникли проблемы с тем, чтобы убедить свою команду менеджеров в необходимости этого, напомните им, что правильный мониторинг позволяет избежать простоев.
Ваше окружение (как вы правильно предположили) находится в беспорядке
Здесь не так уж много дел, кроме как перестроить эту штуку.твойзадача как генерального прокурора — встать и очень четко, очень ГРОМКО обосновать, почему системы необходимо демонтировать по одной и перестроить с использованием структуры, которой можно управлять.

Похоже, вы довольно неплохо разбираетесь в том, что нужно сделать, но если у вас есть вопросы, обязательно задавайте их, и мы постараемся помочь, чем сможем (мы не можем сделать вашу архитектуру за вас, но можем ответить на концептуальные вопросы или практические вопросы типа «Как мне работать Xс инструментом мониторинга Y?»).

Answer

Насколько я понимаю, ваша проблема заключается в том, что она duраспространяется на другие файловые системы (некоторые из которых монтируются в сети или SAN и требуют много времени для подсчета использования).

Я с уважением заявляю, что если вы пытаетесь отслеживать использование файловой системыdu ,неправильныйинструмент для работы. Вы хотите df(о чем вы, по-видимому, знаете, поскольку включили его вывод).

Анализ вывода dfможет помочь вам определить конкретные файловые системы, в которых вы должны работать, duчтобы определить, какие каталоги пожирают все ваше пространство (или, если вам повезет, у полной файловой системы есть определенная ответственная сторона, которой вы можете поручить разобраться в этом самостоятельно). В любом случае вы по крайней мере будете знать, что файловая система заполняется, прежде чем она заполнится (и вывод будет проще анализировать).

Короче говоря: беги.df сначала беги, потомесли вам нужнозапустите duлюбую файловую систему, dfкоторая, как определено, имеет загрузку более (скажем) 85%, чтобы получить более конкретные данные.

Переходя к вашему сценарию, причина duнеуважения к вашему -d(или -x) флагу заключается в вопросе, который вы задаете:

 # pwd   
 /
 # du * (. . .etc. . .)

Вы просите duзапустить все под /-- du -x /bin /home /sbin /usr /tmp /varи т. д. -- duзатем делает именно то, что вы просили (предоставляя вам использование каждой из этих вещей. Если один из аргументов является корнем файловой системы, duпредполагается, что вы знаете, что делаете, и даете использованиечтофайловую систему до первого найденного подмонтированного раздела.

Этокритическиотличается от du -x /(«Расскажите мне о /дополнительных креплениях и игнорируйте их»).

Чтобы исправить ваш сценарий*не cdв каталог, который вы анализируете — вместо этого просто запустите
du /path/to/full/disk | [whatever you want to feed the output through]

Это (или любое другое предложение, которое вы можете получить) не решит ваши две основные проблемы:

Ваша система мониторинга является специальной
Если вы хотите обнаружить проблемы до того, как они укусят вас за гениталии, вамДействительнонеобходимо развернутьдостойная платформа мониторинга. Если у вас возникли проблемы с тем, чтобы убедить свою команду менеджеров в необходимости этого, напомните им, что правильный мониторинг позволяет избежать простоев.
Ваше окружение (как вы правильно предположили) находится в беспорядке
Здесь не так уж много дел, кроме как перестроить эту штуку.твойзадача как генерального прокурора — встать и очень четко, очень ГРОМКО обосновать, почему системы необходимо демонтировать по одной и перестроить с использованием структуры, которой можно управлять.

Похоже, вы довольно неплохо разбираетесь в том, что нужно сделать, но если у вас есть вопросы, обязательно задавайте их, и мы постараемся помочь, чем сможем (мы не можем сделать вашу архитектуру за вас, но можем ответить на концептуальные вопросы или практические вопросы типа «Как мне работать Xс инструментом мониторинга Y?»).

Question 2

Простой ответ: установите инструмент мониторинга инфраструктуры (например, ZenOSS, Zabixx и т. д.).

Если вы ищете что-то индивидуальное, возможно, вам нужен какой-то уровень абстракции для обработки странных различий между машинами, а не делать это каждый раз вручную?

Answer

Простой ответ: установите инструмент мониторинга инфраструктуры (например, ZenOSS, Zabixx и т. д.).

Если вы ищете что-то индивидуальное, возможно, вам нужен какой-то уровень абстракции для обработки странных различий между машинами, а не делать это каждый раз вручную?

Question 3

Я часто даю эту рекомендацию. Инструмент, который я пропагандирую для специальных расчетов использования диска, этоутилита ncdu. Существует --excludeфлаг, который можно указать несколько раз.

Существуют упакованные версии дляСолярис(CSWncdu), или вы можете скомпилировать его из исходников. Это упрощает многое из того, что вы делаете.

Answer

Я часто даю эту рекомендацию. Инструмент, который я пропагандирую для специальных расчетов использования диска, этоутилита ncdu. Существует --excludeфлаг, который можно указать несколько раз.

Существуют упакованные версии дляСолярис(CSWncdu), или вы можете скомпилировать его из исходников. Это упрощает многое из того, что вы делаете.

Question 4

Я думаю, что вы ищете что-то вроденкду. Это позволит вам избежать перемещения по каталогам, но при этом иметь возможность определить, где используется диск.

Я повторю другие ответы, сказав, что это инструмент, который вы используетепослеВаши системы мониторинга обнаружили проблему — это не тот инструмент, который вы хотели бы использовать неинтерактивно. Фактически, поскольку он основан на ncurses, делать это было бы муторно. Любой системный администратор, который стоит своих денег, позволит вам загрузить проверенный и простой инструмент для предотвращения ресурсоемких, хакнутых вместе чудовищ bash, подобных тому, что вы описали. Он будет использовать гораздо больше памяти, гораздо больше ввода-вывода и будет гораздо опаснее, чем это «запрещенное» ПО.

Answer

Я думаю, что вы ищете что-то вроденкду. Это позволит вам избежать перемещения по каталогам, но при этом иметь возможность определить, где используется диск.

Я повторю другие ответы, сказав, что это инструмент, который вы используетепослеВаши системы мониторинга обнаружили проблему — это не тот инструмент, который вы хотели бы использовать неинтерактивно. Фактически, поскольку он основан на ncurses, делать это было бы муторно. Любой системный администратор, который стоит своих денег, позволит вам загрузить проверенный и простой инструмент для предотвращения ресурсоемких, хакнутых вместе чудовищ bash, подобных тому, что вы описали. Он будет использовать гораздо больше памяти, гораздо больше ввода-вывода и будет гораздо опаснее, чем это «запрещенное» ПО.

Редактировать 20.09.2012

Редактировать 20.09.2012

Редактировать: Команда обновлена для корректного использования du -x или du -d в RHEL5 или Solaris 10 соответственно.

Пример для платформы Linux: xargs du -shx

Пример для платформы Solaris: xargs du -shd

решение1

решение2

решение3

решение4

Связанный контент

Редактировать 20.09.2012

Редактировать: Команда обновлена ​​для корректного использования du -x или du ​​-d в RHEL5 или Solaris 10 соответственно.

Пример для платформы Linux: xargs du -shx

Пример для платформы Solaris: xargs du -shd

решение1

решение2

решение3

решение4

Связанный контент

Редактировать: Команда обновлена для корректного использования du -x или du -d в RHEL5 или Solaris 10 соответственно.