
У меня проблема с системой Debian. Сегодня ровно в 04:00 она перестала отвечать на nagios. Я также не могу войти по SSH. Это происходит не в первый раз, но я впервые наблюдаю это с nagios.
У этого бокса есть одна особенная, необычная вещь: он загружается с флешки. Вот почему я подумал, что было бы разумно сопоставить /var /tmp с tmpfs.
Я почти уверен, что если я его перезагружу, он снова заработает. Но поскольку /var/log отображается в памяти, я не могу прочитать логи после перезагрузки.
Следующая проблема заключается в том, что оборудование находится за пределами офиса, поэтому я не могу войти в систему локально.
Сначала проблема может быть в том, что tmpfs заполняется. Но nagios не предупреждал, что больше не может подключиться. Я установил порог предупреждения на 90% свободного места. Так что, похоже, это не оно.
Другие, возможно, интересные симптомы:
- сервер openVPN все еще работает
- маршрутизация все еще работает
- порт SSH все еще открыт и меня просят ввести имя пользователя. Но если я ввожу пароль, соединение обрывается
- порт 80 открыт, но apache не отвечает
Вопрос, который меня больше всего интересует: Что может делать система Debian в 04:00 утра? Что-то вроде проверки обновлений?
Я благодарен за любые идеи или указания в правильном направлении. Есть ли что-то, что стоит мониторить с помощью nagios, чтобы получить подсказку? В следующий раз я добавлю мониторинг использования swap.
решение1
У нас было такое, когда на сервере заканчивалась память. Все запущенные процессы продолжались, но выделение новых процессов могло закончиться неудачей.
Если вы отслеживаете использование памяти, это может ответить на вопрос. Вы также можете попробовать удаленно вести журнал.
Однако, чтобы ответить на ваш вопрос, проверьте ваш /etc/cron.daily - эти скриптыможетзапустить в 4 утра. Вы также можете проверить /etc/cron.d/ и /etc/crontab, чтобы увидеть, есть ли запланированные задачи.