LInux: Как диагностировать/изолировать причину «случайных» зависаний и спонтанных перезагрузок?

LInux: Как диагностировать/изолировать причину «случайных» зависаний и спонтанных перезагрузок?

Итак, вместо того, чтобы гадать, в чем причина (хотя я ставлю на драйверы NVIDIA), с чего мне начать, чтобы выяснить некоторые факты?

Я несколько раз просматривал /var/log, но там ОЧЕНЬ много всего, и я (пока) не могу выделить важные фрагменты.


Предыстория: краткая версия

Я перешел с WinXP на Ubuntu Karmic сразу после того, как он стал доступен.

С тех пор у меня была серияпо-видимомуслучайные сбои, которые проявляются как:

  • спонтанная перезагрузка
  • полная блокировка, когда моя USB-клавиатура и мышь перестают реагировать (вплоть до того, что все светодиоды выключаются). Также я обычно не могу подключиться к коробке по ssh, когда это происходит.

Я провел много поисков и, похоже, главным подозреваемым является Nvidia, но я понятия не имею, с чего начать, чтобы выяснить истинную причину.

Предложения?



Предыстория: Длинная версия

Иногда я могу прожить целую неделю без сбоев, а потом за два дня их происходит 5.

Желая исключить возможных подозреваемых, я со временем внес несколько изменений, но безрезультатно:

  • Изначально я использовал KVM для виртуализации, теперь я использую VirtualBox OSE.
  • У меня NFS работал в ядре, но теперь я использую Samba
  • Я использовал Compiz, но потом отключил его.
  • Я перешел с 64-битной Karmic на 32-битную (есть и другие причины)
  • Я пробовал Ubuntu, Kubuntu и Xubuntu. Каждый раз одна и та же проблема.
  • Я откатил драйвер Nvidia с версии 185 до версии 96 (NVIDIA Linux x86 Kernel Module 96.43.13 Чтв Июн 25 18:42:21 PDT 2009). Этокажетсячтобы уменьшить частоту ошибок.


Что касается того, что работает в данный момент, это может варьироваться. Ниже приведены общие, но не обязательно работающие при каждом сбое:

  • Firefox 3.5
  • VirtualBox OSE с 1 или 2 виртуальными машинами Windows XP
  • скайп
  • Rhythmbox или Exaile


Моему оборудованию 2–3 года:

  • Core 2 Duo 6300
  • 4 ГБ ОЗУ
  • какая-то порода материнских плат Intel того времени
  • двухъядерная видеокарта Asus с чипсетом Nvdia GeForce 7300 GS
  • 2 жестких диска SATA
  • два монитора (поэтому я полагаюсь на фирменные драйверы nvidia)


Я слежу за обновлениями своей системы.

Надеюсь, приведенные выше данные подтолкнут кого-нибудь к предложению конкретного типа журнала или конфигурации, которые стоит изучить.

Обновления
ОЗУ, похоже, в порядке.
Согласно предложению ниже, опубликую повторно в суперпользователе.

решение1

Linux и другие Unix-подобные системы более чувствительны к нестабильной оперативной памяти, чем Windows. Я бы запустил memtest86 и проверил оперативную память

решение2

Подобные проблемы действительно могут быть вызваны неисправным оборудованием (если вы подозреваете драйвер nvidia, возможно, у видеокарты аппаратная ошибка?)

  • если у вас включен мониторинг температуры (с помощью sensor-applet / lm_sensors), есть ли высокие показания?
  • Вы делали разгон?
  • у вас тоже были странные сбои/зависания/перезагрузки в Windows?

Если система зависла, вот что следует проверить:

  • мигают ли светодиоды клавиатуры? Насколько мне известно, это может означать Kernel Panic (т.е. сбой ядра)
  • можете ли вы связаться с системой с помощью Ping?
  • используйте комбинацию клавиш SysRq (она должна быть включена заранее), чтобы проверить, сможете ли вы получить ответ от системы
    • видетьhttp://en.wikipedia.org/wiki/Magic_SysRq_keyдля подробностей
    • вам следует проверить, что клавиша действительно включена и работает, нажав Alt+SysRq+h на виртуальном терминале (переключитесь туда с помощью Ctrl+Alt+F1; переключитесь обратно с помощью Ctrl+Alt+F7)
  • после перезагрузки проверьте файлы журналов (/var/log/syslog, /var/log/Xorg.0.log) на предмет последних сообщений

решение3

Может быть, это аппаратная проблема? У меня есть опыт с неисправной видеокартой, которая подвешивала компьютер, не оставляя никаких следов в журнале ядра. Чтобы изолировать проблему, попробуйте какой-нибудь LiveCD, который использует композитинг, или еще лучше: поиграйте в 3D-игру ;-). Смотрите:соответствующий пост на форуме UL

Связанный контент