
Mi servidor falló 3 veces (2 veces menos que hace 24 horas) y una vez hace 1 semana. Cada vez, no se podía hacer ping al servidor, hasta que el host reiniciaba la máquina. Es un servidor dedicado en ServerPronto con 4 GB de RAM, CPU dual o cuádruple con 3,1 ghz, ubicado en Florida, creo. Energía más que suficiente para manejar la carga con toneladas de CPU de sobra. El grupo de búfer de Innodb tiene suficiente memoria (1,3 GB) para tener toda la tabla MySQL en la memoria con espacio adicional. APC también tiene memoria más que suficiente.
Tengo New Relic instalado en mi servidor. Cada una de las 3 veces, verifiqué el uso de la CPU, el uso de la memoria, el espacio en disco, la E/S de red y todos estaban completamente estables. Miré los tiempos de respuesta a las solicitudes y todos fueron mínimamente normales. Mi servidor recibió 500 solicitudes por minuto, durante la hora previa al fallo: esto es muy normal para mi servidor. Entonces, de repente, sin ningún pico, ¡las solicitudes por minuto bajaron a 0! El promedio de carga fue 0.05 (muy, muy pequeño, pero normal para mi servidor), el uso de memoria fue del 30%, también normal, la E/S de la red fue de 400 KB/seg, también normal. El disco IO estaba en 1-2%, también normal. El archivo de registro debe haber estado funcionando porque veo las advertencias estándar en los archivos de registro de Apache, pero no hay absolutamente ningún error antes del bloqueo.
El último cierre se produjo durante un momento en el que mi tráfico recibe una cantidad mínima de tráfico web.
Además, no hay trabajos cron ejecutándose en el momento de los incidentes. No hay errores ni advertencias en los registros de errores, registros de PHP/mysql en el momento del apagado. No había IDE ni conexiones SSH abiertas al servidor en el momento del cierre.
Cada vez que se cae, tan pronto como se reinicia, todo vuelve a funcionar.
He estado ejecutando el mismo software durante 2,5 años en dos de mis hosts anteriores y no tuve este tipo de problema. Además, no he realizado ningún cambio de código en el último mes (para la aplicación que se está ejecutando actualmente).
Cuando configuré esta máquina por primera vez con serverPronto hace aproximadamente 1 mes, tuvieron algún problema de hardware con el cable de mi máquina: no fue un buen comienzo. Pero lo solucionaron y no tuve ningún problema durante aproximadamente 4 semanas (excepto una interrupción de diez minutos que no requirió reiniciar el servidor).
Teniendo en cuenta toda esta información, ¿significa esto que ServerPronto (mi host) está teniendo un problema de hardware actualmente? o hay otra posibilidad.
Respuesta1
Cuando configuré esta máquina por primera vez con serverPronto hace aproximadamente 1 mes,
Malas noticias. TODAVÍA tienen problemas de hardware. Tan simple como eso.
Si tiene instalados los controladores correctos, la respuesta es trivial: hay hardware roto involucrado.