Мой сервер, который работал последние 6 месяцев, сегодня перезагрузился. Пока не могу узнать причину. Проверил следующее...
- последняя перезагрузка показывает "reboot system boot 4.14.0-generic"
- /var/log/syslog - нет записей о перезагрузке/панике 11:21 AM - последние журналы приложений (общие) 11:23 AM - журналы загрузки системы 11:24 AM - возобновление журналов приложений
- /var/messages - Записей, связанных с перезагрузкой, на данный момент не найдено.
- /proc/sys/kernel/panic равен 0.
- /etc/apt/apt.conf.d/50unattended-upgrades //Unattended-Upgrade::Automatic-Reboot "false";
- Проверил консоль управления (сервера) — никаких сообщений об активности и тревогах оборудования не поступало.
Сервер заработал через минуту без каких-либо проблем, но мне интересно узнать причину.
Пожалуйста, помогите мне докопаться до сути...
решение1
Как упомянул Джеральд, Ubuntu 16.04 устарела и ее следует обновить (или приобрести новый сервер с 20.04 и отключить старую).
После 6 месяцев постоянной работы небольшой сбой, который приводит к перезагрузке, не является маловероятным. Для этого есть несколько причин, и то, что вы посмотрели, могло бы дать вам подсказку, но когда вы не видите абсолютно ничего, есть две основные причины, по которым это может произойти:
- Электричество отключилось
- Аппаратный сбой, который не удалось обнаружить программным обеспечением, и на сервере установлен сторожевой таймер, позволяющий ему, по крайней мере, завершить работу (возможно, он отправил сообщение APCI, хотя оно могло быть зарегистрировано; если оборудование работает неправильно, программное обеспечение не сможет сообщить о проблеме)
Если он не перезагрузился автоматически, значит, он просто завис, что также указывает на проблему с оборудованием, и программное обеспечение не успело ничего с ней сделать.
Файл /proc/sys/kernel/panic
является флагом, сообщающим ядру, что делать при обнаружении ошибки ядром (т.е. в программном обеспечении). Подробности можно найтиздесьПоскольку вы говорите, что он равен нулю, он не будет автоматически перезагружать программное обеспечение при возникновении паники.
С моей стороны, у меня однажды была проблема с приемником Bluetooth. Он получал так много обращений, что через несколько минут создавал блокировку в ядре. Однако это не было четко отражено в журналах. Однако на том компьютере был режим отладки, и я мог прослушивать сообщения на порту USB. Это дало мне необходимую информацию (тонны сообщений о Bluetooth). Отключение этого режима снова сделало систему стабильной. Поскольку у вас было только одно событие, я бы не стал беспокоиться об этом. Если оно повторяется снова и снова, вероятно, пора рассмотреть возможность использования другого оборудования.