Estoy ejecutando un servidor interno bastante simple para alojar GitLab y MatterMost (alternativa al chat de Slack). El problema que tengo es que 9 de cada 10 veces, si necesito reiniciar el servidor, nunca vuelve a funcionar por sí solo (cuelga; el encabezado es solo una pantalla negra en la sala del servidor) y tengo que ingresar al sala de servidores y reinícielo por completo. Esto es un problema porque quiero que pueda reiniciarse sin problemas en caso de que no esté en la oficina para hacerlo manualmente.
Aquí hay una copia de mi /var/log/syslog
: soy nuevo en seguir estos registros y no veo ninguna señal de alerta obvia. ¿Es este incluso el archivo de registro que debería mirar en estas circunstancias?
Respuesta1
Desactivaría los servicios, empezando por IPMI y EDAC, y vería si alguno es el responsable. Supongo que estás al día con los paquetes. Pruebe kernels más recientes.
¿Has probado la RAM? ¿Es ECC?
Cuando dices "colgar", ¿hay actividad en el disco? ¿Algo más que sugiera vida?