"¿Lo que sucede?" monitor de rendimiento del servidor

"¿Lo que sucede?" monitor de rendimiento del servidor

Después de revisar algún hilo sobre software de monitoreo de servidores, termino con una pregunta simple:

¿Cuál de las herramientas de monitoreo de servidores debo usar para la detección automática de situaciones "anormales" con recomendaciones sobre cómo solucionarlas?

Busco software que verifique el rendimiento del sistema después de la instalación y calculo algunos valores de carga promedio (memoria, CPU, etc.). Y cuando sucede algo (la carga de la CPU aumenta al 20%), intenta detectar el motivo. Si es Apache, debería verificar los registros de acceso. Si es mysql, debería verificar los registros de mysql y decirme qué sucede. Si esto se debe a que algún usuario decodifica muchas imágenes, me gustaría saber qué comando se ejecuta, cuándo y nombre de usuario. Lo mismo ocurre con el uso del disco, la memoria, la cantidad de procesos, los subprocesos, etc.

Idealmente, este software debería verificar periódicamente el sistema e informar problemas: errores en el registro de errores de PHP, paquetes desactualizados, vulnerabilidades de seguridad.

En otras palabras, estoy buscando un software que mantenga mi servidor Debian/Apache/PHP/MySQL simple sin obligarme a monitorear los gráficos todos los días.

Respuesta1

A diferencia de Zabbix - mencionado porMaxwell- es el venerablenagios(y es una bifurcación relativamente reciente,glaseado). Este marco existe desde hace más de diez años y es increíblemente estable; el único inconveniente es la instalación y configuración, que requiere mucho más tiempo (especialmente la primera vez) que un sistema respaldado por una empresa comercial como Zabbix.

Ambos tienen su lugar en el ecosistema, por supuesto, por lo que te sugiero que pruebes ambos. Sin embargo, como mencioné en mi comentario: cuanto más profundo sea el tipo de monitoreo que pretenda realizar, más esfuerzo deberá esperar, ya sea escribiendo sus propios complementos/scripts o buscando/descargando/modificando el trabajo de otros. .

¡Buena suerte!

Respuesta2

Hay muchos softwares como ese, una cosa a tener en cuenta es que debes ejecutarlo en un host diferente o corres un alto riesgo de no recibir una notificación si algo sale mal.

Como ejemplo, usamos una combinación de nagios (se encarga de todo el monitoreo y alertas, en otras palabras, se encarga de despertar a alguien cuando es necesario que un operador mire algo) y cactus (también podría hacer alertas, pero solo Úselo para recopilar y agregar varias métricas, que van desde el tráfico de red hasta la carga del sistema y las estadísticas de spam de correo electrónico).

Cuando llegue el momento en que reciba una alerta (de nagios cactus zabbix, lo que sea), tener algunos datos de rendimiento para mirar (cacti, zabbix, otros lo harán) generalmente lo ayudará a diagnosticar dónde está el problema.

En la pila LAMP habitual que usted describe, las dos situaciones problemáticas más comunes (al menos en mi experiencia) son el servidor HTTP o SQL que no responde en absoluto o en un tiempo razonable (una sonda Nagios lo comprobará) o la carga promedio en el el sistema está yendo terriblemente alto.

Estas dos comprobaciones probablemente detectarán el 95% de sus problemas, pero hay muchas otras cosas que debe buscar: ejemplos:

  1. Apache trabaja constantemente con la cantidad máxima de procesos/hilos que configuró, lo que significa que su servidor no está a la altura de la carga.
  2. el sistema funciona "bien" pero con una unidad fallida en el RAID (no sabes con qué frecuencia este tipo de cosas pasan desapercibidas durante meses, o al menos hasta la siguiente falla del disco;)

Casi todos los productos que encontrará podrán monitorear/graficar todo lo que les pueda arrojar; generalmente puede extenderlos mediante simples scripts de shell, programas cortos y todo eso, además de los instrumentos incluidos y el omnipresente SNMP. .

Respuesta3

zabbixLa solución de monitoreo puede monitorear lo que desee y desencadenar acciones en consecuencia, las acciones pueden ser, por ejemplo, ejecutar un script que procesa registros y envía el resultado si es necesario. También puede activar una acción cuando se cumplen una o más condiciones (por ejemplo, la salida del script de análisis de registros muestra un error y la carga de la CPU es superior al 40%).

Respuesta4

Instalación de Nagios

Nagios es un host y monitor de servicios diseñado para informarle sobre problemas de red antes de que lo hagan sus clientes, usuarios finales o administradores. Ha sido diseñado para ejecutarse en el sistema operativo Linux, pero también funciona bien en la mayoría de las variantes. El demonio de monitoreo ejecuta verificaciones intermitentes en los hosts y servicios que usted especifica mediante complementos externos que devuelven información de estado a Nagios. Cuando se encuentran problemas, el demonio puede enviar notificaciones a los contactos administrativos de diferentes maneras (correo electrónico, mensajes instantáneos, SMS, etc.). Tener una instalación de Nagios en su servidor ayudará a mejorar la confiabilidad de su servidor.

Nagios tiene muchas características, lo que lo convierte en una herramienta de monitoreo muy poderosa. Algunas de las características principales se enumeran a continuación: Monitoreo de servicios de red (SMTP, POP3, HTTP, NNTP, PING, etc.) Monitoreo de recursos del host (carga del procesador, uso de disco y memoria, procesos en ejecución, archivos de registro, etc.) Monitoreo de factores ambientales como la temperatura Tiempo de inactividad programado para suprimir notificaciones de hosts y servicios durante períodos de interrupciones planificadas Diseño de complemento simple que permite a los usuarios desarrollar fácilmente sus propias comprobaciones de hosts y servicios Capacidad para definir la jerarquía de hosts de red, lo que permite la detección y distinción entre hosts que están inactivos y aquellos que son inalcanzables Soporte para implementar servidores de monitoreo redundantes y distribuidos Capacidad de reconocer problemas a través de la interfaz web Notificaciones de contacto cuando ocurren problemas con el servicio o el host y se resuelven (por correo electrónico, buscapersonas u otro método definido por el usuario) Escalamiento opcional del host y notificaciones de servicio a diferentes grupos de contactos Capacidad para definir controladores de eventos que se ejecutarán durante eventos de servicio o host para una resolución proactiva de problemas Interfaz de comando externa que permite realizar modificaciones sobre la marcha en el comportamiento de monitoreo y notificación mediante el uso de controladores de eventos , la interfaz web y aplicaciones de terceros Retención del estado del host y del servicio durante los reinicios del programa

información relacionada