Editar 20/09/2012

Question 1

Tu problema, según tengo entendido, es quedu está descendiendo a otros sistemas de archivos (algunos de los cuales son montajes de red o SAN, y tardan mucho en contar su utilización).

Respetuosamente lo presento si está intentando monitorear la utilización del sistema de archivosdu es elequivocadoherramienta para el trabajo. que quieras df(que aparentemente conoces ya que incluiste su resultado).

Analizar el resultado dfpuede ayudarle a apuntar a sistemas de archivos específicos en los que debería ejecutar dupara determinar qué directorios están consumiendo todo su espacio (o si tiene suerte, el sistema de archivos completo tiene una parte responsable específica a quien puede decirle que lo resuelva). ellos mismos). En cualquier caso, al menos sabrá que un sistema de archivos se está llenando antes de que esté lleno (y la salida es más fácil de analizar).

En resumen: correrdf primero ejecuta, luegosi usted tiene queejecútelo duen cualquier sistema de archivos dfidentificado con una utilización superior (digamos) al 85% para obtener detalles más específicos.

Pasando a tu script, la razón dupor la que no se respeta tu -d(o -x) bandera es por la pregunta que estás haciendo:

 # pwd   
 /
 # du * (. . .etc. . .)

Estás solicitando duejecutar todo lo que aparece debajo /, du -x /bin /home /sbin /usr /tmp /varetc., y duluego estás haciendo exactamente lo que pediste (dándote el uso de cada una de esas cosas. Si uno de los argumentos resulta ser una raíz del sistema de archivosdu se supone que sabes lo que estás hacer y dar el uso deesosistema de archivos hasta el primer submontaje que encuentre.

Esto escríticamentediferente de du -x /("Cuéntame /e ignora cualquier submontaje").

Para arreglar tu script*no cden el directorio que está analizando; en su lugar, simplemente ejecute
du /path/to/full/disk | [whatever you want to feed the output through]

Esto (o cualquier otra sugerencia que pueda recibir) no resuelve sus dos problemas principales:

Su sistema de seguimiento es ad-hoc
Si quieres detectar problemas antes de que te piquen en los genitales,en realidadnecesidad de desplegar unplataforma de seguimiento decente. Si tiene problemas para lograr que su equipo de administración acepte esto, recuérdeles que un monitoreo adecuado le permite evitar el tiempo de inactividad.
Tu entorno (como bien habrás supuesto) es un desastre
No hay mucho que hacer aquí excepto reconstruir la cosa - Essutrabajo como SA para levantarse y presentar un caso de negocios muy claro y muy RUIDOSO de por qué los sistemas deben ser desmantelados uno a la vez y reconstruidos con una estructura que pueda administrarse.

Parece que tiene un manejo bastante decente de lo que se debe hacer, pero si tiene preguntas, hágalas y trataremos de ayudarlo tanto como podamos (no podemos hacer su arquitectura por usted, pero Puede responder preguntas conceptuales o prácticas de tipo "¿Cómo hago Xcon la herramienta de monitoreo Y?"

Answer

Tu problema, según tengo entendido, es quedu está descendiendo a otros sistemas de archivos (algunos de los cuales son montajes de red o SAN, y tardan mucho en contar su utilización).

Respetuosamente lo presento si está intentando monitorear la utilización del sistema de archivosdu es elequivocadoherramienta para el trabajo. que quieras df(que aparentemente conoces ya que incluiste su resultado).

Analizar el resultado dfpuede ayudarle a apuntar a sistemas de archivos específicos en los que debería ejecutar dupara determinar qué directorios están consumiendo todo su espacio (o si tiene suerte, el sistema de archivos completo tiene una parte responsable específica a quien puede decirle que lo resuelva). ellos mismos). En cualquier caso, al menos sabrá que un sistema de archivos se está llenando antes de que esté lleno (y la salida es más fácil de analizar).

En resumen: correrdf primero ejecuta, luegosi usted tiene queejecútelo duen cualquier sistema de archivos dfidentificado con una utilización superior (digamos) al 85% para obtener detalles más específicos.

Pasando a tu script, la razón dupor la que no se respeta tu -d(o -x) bandera es por la pregunta que estás haciendo:

 # pwd   
 /
 # du * (. . .etc. . .)

Estás solicitando duejecutar todo lo que aparece debajo /, du -x /bin /home /sbin /usr /tmp /varetc., y duluego estás haciendo exactamente lo que pediste (dándote el uso de cada una de esas cosas. Si uno de los argumentos resulta ser una raíz del sistema de archivosdu se supone que sabes lo que estás hacer y dar el uso deesosistema de archivos hasta el primer submontaje que encuentre.

Esto escríticamentediferente de du -x /("Cuéntame /e ignora cualquier submontaje").

Para arreglar tu script*no cden el directorio que está analizando; en su lugar, simplemente ejecute
du /path/to/full/disk | [whatever you want to feed the output through]

Esto (o cualquier otra sugerencia que pueda recibir) no resuelve sus dos problemas principales:

Su sistema de seguimiento es ad-hoc
Si quieres detectar problemas antes de que te piquen en los genitales,en realidadnecesidad de desplegar unplataforma de seguimiento decente. Si tiene problemas para lograr que su equipo de administración acepte esto, recuérdeles que un monitoreo adecuado le permite evitar el tiempo de inactividad.
Tu entorno (como bien habrás supuesto) es un desastre
No hay mucho que hacer aquí excepto reconstruir la cosa - Essutrabajo como SA para levantarse y presentar un caso de negocios muy claro y muy RUIDOSO de por qué los sistemas deben ser desmantelados uno a la vez y reconstruidos con una estructura que pueda administrarse.

Parece que tiene un manejo bastante decente de lo que se debe hacer, pero si tiene preguntas, hágalas y trataremos de ayudarlo tanto como podamos (no podemos hacer su arquitectura por usted, pero Puede responder preguntas conceptuales o prácticas de tipo "¿Cómo hago Xcon la herramienta de monitoreo Y?"

Question 2

Respuesta simple: instale una herramienta de monitoreo de infraestructura (como ZenOSS, Zabixx, etc.).

Si está buscando algo personalizado, ¿quizás necesite algún tipo de capa de abstracción para manejar diferencias extrañas por máquina en lugar de administrarlas manualmente cada vez?

Answer

Respuesta simple: instale una herramienta de monitoreo de infraestructura (como ZenOSS, Zabixx, etc.).

Si está buscando algo personalizado, ¿quizás necesite algún tipo de capa de abstracción para manejar diferencias extrañas por máquina en lugar de administrarlas manualmente cada vez?

Question 3

Hago esta recomendación a menudo. La herramienta que recomiendo para los cálculos de uso de disco ad-hoc es lautilidad ncdu. Hay una --excludebandera que se puede especificar varias veces.

Hay versiones empaquetadas paraSolaris(CSWncdu), o puedes compilarlo desde el código fuente. Simplifica mucho de lo que estás haciendo.

Answer

Hago esta recomendación a menudo. La herramienta que recomiendo para los cálculos de uso de disco ad-hoc es lautilidad ncdu. Hay una --excludebandera que se puede especificar varias veces.

Hay versiones empaquetadas paraSolaris(CSWncdu), o puedes compilarlo desde el código fuente. Simplifica mucho de lo que estás haciendo.

Question 4

Creo que lo que buscas es algo comoncdu. Eso le permitirá dejar de recorrer directorios y al mismo tiempo podrá encontrar dónde se está consumiendo el disco.

Me haré eco de las otras respuestas diciendo que esta es la herramienta que utilizasdespuéssus sistemas de monitoreo han detectado un problema; no es el tipo de herramienta que le gustaría utilizar de forma no interactiva. De hecho, debido a que se basa en maldiciones, hacerlo sería una trampa. Cualquier administrador de sistemas que se precie le permitirá descargar una herramienta sencilla y examinada para evitar monstruosidades bash hambrientas de recursos y pirateadas como la que ha descrito. Utilizará mucha más memoria, muchas más E/S y será mucho más peligroso que ese software "prohibido".

Answer

Creo que lo que buscas es algo comoncdu. Eso le permitirá dejar de recorrer directorios y al mismo tiempo podrá encontrar dónde se está consumiendo el disco.

Me haré eco de las otras respuestas diciendo que esta es la herramienta que utilizasdespuéssus sistemas de monitoreo han detectado un problema; no es el tipo de herramienta que le gustaría utilizar de forma no interactiva. De hecho, debido a que se basa en maldiciones, hacerlo sería una trampa. Cualquier administrador de sistemas que se precie le permitirá descargar una herramienta sencilla y examinada para evitar monstruosidades bash hambrientas de recursos y pirateadas como la que ha descrito. Utilizará mucha más memoria, muchas más E/S y será mucho más peligroso que ese software "prohibido".

Editar 20/09/2012

Editar 20/09/2012

Editar: el comando se ha actualizado para utilizar correctamente du -x o du -d en RHEL5 o Solaris 10, respectivamente.

Ejemplo de plataforma Linux: xargs du -shx

Ejemplo de plataforma Solaris: xargs du -shd

Respuesta1

Respuesta2

Respuesta3

Respuesta4

información relacionada