Mi servidor, que estuvo activo durante los últimos 6 meses, se reinició hoy. No se puede saber el motivo hasta el momento. Comprobó lo siguiente...
- El último reinicio muestra "reboot system boot 4.14.0-generic"
- /var/log/syslog - no hay entrada de reinicio/pánico 11:21 a. m. - últimos registros de aplicaciones (genéricos) 11:23 a. m. - registros de inicio del sistema 11:24 a. m. - reanudación de los registros de aplicaciones
- /var/messages: no se encontró ninguna entrada relacionada con el reinicio en ese momento.
- /proc/sys/kernel/panic es 0.
- /etc/apt/apt.conf.d/50unattended-upgrades //Actualización-unattendida::Reinicio-automático "false";
- Se revisó la consola de administración (del servidor) y no se informó ninguna actividad ni alarma de hardware.
El servidor apareció en un minuto sin ningún problema, pero tengo curiosidad por saber el motivo.
Por favor guíame para llegar al fondo de esto...
Respuesta1
Como mencionó Gerald, Ubuntu 16.04 está desactualizado y debe actualizarse (o obtener un nuevo servidor con 20.04 y apagar el anterior).
Después de 6 meses de funcionamiento constante, no es improbable que se produzca un pequeño fallo que obligue a reiniciar. Hay varias razones para esto, y lo que has mirado podría haberte dado una pista, pero cuando no ves absolutamente nada, hay dos razones principales por las que podría suceder:
- Se fue la luz
- Fallo de hardware que no se pudo detectar en el software y el servidor tiene un perro guardián que le permite al menos apagarse (tal vez envió un mensaje APCI aunque eso podría haberse registrado, si el hardware no funciona del todo bien, el software fallaría al informar el asunto)
Si no se reinició automáticamente, simplemente se quedó atascado, eso también indica un problema de hardware y el software nunca tuvo la oportunidad de hacer nada al respecto.
El /proc/sys/kernel/panic
archivo es una bandera para indicarle al kernel qué hacer ante un error detectado por el kernel (es decir, en el software). Puedes encontrar detallesaquí. Como usted dice que es cero, no se reiniciará automáticamente en el software en caso de pánico.
Por mi parte, una vez tuve un problema con un receptor Bluetooth. Recibiría tantas visitas que después de unos minutos crearía un bloqueo en el kernel. Sin embargo, no estaba claramente informado en los registros. Esa computadora, sin embargo, tenía un modo de depuración y podía escuchar mensajes en el puerto USB. Eso me dio la información que necesito (toneladas de mensajes sobre Bluetooth). Al desactivarlo, el sistema volvió a estabilizarse. Como solo tuviste un evento, no me preocuparía por eso. Si se repite una y otra vez, probablemente sea el momento de considerar el uso de hardware diferente.