Итак, вместо того, чтобы гадать, в чем причина (хотя я ставлю на драйверы NVIDIA), с чего мне начать, чтобы выяснить некоторые факты?
Я несколько раз просматривал /var/log, но там ОЧЕНЬ много всего, и я (пока) не могу выделить важные фрагменты.
Предыстория: краткая версия
Я перешел с WinXP на Ubuntu Karmic сразу после того, как он стал доступен.
С тех пор у меня была серияпо-видимомуслучайные сбои, которые проявляются как:
- спонтанная перезагрузка
- полная блокировка, когда моя USB-клавиатура и мышь перестают реагировать (вплоть до того, что все светодиоды выключаются). Также я обычно не могу подключиться к коробке по ssh, когда это происходит.
Я провел много поисков и, похоже, главным подозреваемым является Nvidia, но я понятия не имею, с чего начать, чтобы выяснить истинную причину.
Предложения?
Предыстория: Длинная версия
Иногда я могу прожить целую неделю без сбоев, а потом за два дня их происходит 5.
Желая исключить возможных подозреваемых, я со временем внес несколько изменений, но безрезультатно:
- Изначально я использовал KVM для виртуализации, теперь я использую VirtualBox OSE.
- У меня NFS работал в ядре, но теперь я использую Samba
- Я использовал Compiz, но потом отключил его.
- Я перешел с 64-битной Karmic на 32-битную (есть и другие причины)
- Я пробовал Ubuntu, Kubuntu и Xubuntu. Каждый раз одна и та же проблема.
- Я откатил драйвер Nvidia с версии 185 до версии 96 (NVIDIA Linux x86 Kernel Module 96.43.13 Чтв Июн 25 18:42:21 PDT 2009). Этокажетсячтобы уменьшить частоту ошибок.
Что касается того, что работает в данный момент, это может варьироваться. Ниже приведены общие, но не обязательно работающие при каждом сбое:
- Firefox 3.5
- VirtualBox OSE с 1 или 2 виртуальными машинами Windows XP
- скайп
- Rhythmbox или Exaile
Моему оборудованию 2–3 года:
- Core 2 Duo 6300
- 4 ГБ ОЗУ
- какая-то порода материнских плат Intel того времени
- двухъядерная видеокарта Asus с чипсетом Nvdia GeForce 7300 GS
- 2 жестких диска SATA
- два монитора (поэтому я полагаюсь на фирменные драйверы nvidia)
Я слежу за обновлениями своей системы.
Надеюсь, приведенные выше данные подтолкнут кого-нибудь к предложению конкретного типа журнала или конфигурации, которые стоит изучить.
Обновления
ОЗУ, похоже, в порядке.
Согласно предложению ниже, опубликую повторно в суперпользователе.
решение1
Linux и другие Unix-подобные системы более чувствительны к нестабильной оперативной памяти, чем Windows. Я бы запустил memtest86 и проверил оперативную память
решение2
Подобные проблемы действительно могут быть вызваны неисправным оборудованием (если вы подозреваете драйвер nvidia, возможно, у видеокарты аппаратная ошибка?)
- если у вас включен мониторинг температуры (с помощью sensor-applet / lm_sensors), есть ли высокие показания?
- Вы делали разгон?
- у вас тоже были странные сбои/зависания/перезагрузки в Windows?
Если система зависла, вот что следует проверить:
- мигают ли светодиоды клавиатуры? Насколько мне известно, это может означать Kernel Panic (т.е. сбой ядра)
- можете ли вы связаться с системой с помощью Ping?
- используйте комбинацию клавиш SysRq (она должна быть включена заранее), чтобы проверить, сможете ли вы получить ответ от системы
- видетьhttp://en.wikipedia.org/wiki/Magic_SysRq_keyдля подробностей
- вам следует проверить, что клавиша действительно включена и работает, нажав Alt+SysRq+h на виртуальном терминале (переключитесь туда с помощью Ctrl+Alt+F1; переключитесь обратно с помощью Ctrl+Alt+F7)
- после перезагрузки проверьте файлы журналов (/var/log/syslog, /var/log/Xorg.0.log) на предмет последних сообщений
решение3
Может быть, это аппаратная проблема? У меня есть опыт с неисправной видеокартой, которая подвешивала компьютер, не оставляя никаких следов в журнале ядра. Чтобы изолировать проблему, попробуйте какой-нибудь LiveCD, который использует композитинг, или еще лучше: поиграйте в 3D-игру ;-). Смотрите:соответствующий пост на форуме UL