Ubuntu 10.04 서버 충돌

Ubuntu 10.04 서버 충돌

저는 Ubuntu 10.04(x64)를 웹/mysql 서버로 실행하고 있습니다.

서버가 SSH, Ping, HTTP 등에 응답하지 않게 되었고 시스템에 물리적으로 접근할 수 있는 기술자가 나에게 다음 화면 캡처를 보냈습니다.

http://img442.imageshack.us/img442/389/img00062201012211332.jpg

재부팅하기 전에 연결된 모니터에서 (그리고 상황이 수정되었습니다). 재부팅 후 로그를 확인했는데 텍스트를 찾을 수 없어 이 정보가 어떤 로그에 보관되어 있는지 잘 모르겠습니다.

무슨 일이 일어났는지 조사하고 다시는 이런 일이 발생하지 않도록 도와줄 수 있는 사람이 있나요?

감사해요

답변1

커널 패닉은 여러 가지 이유, 일반적으로 모듈 문제(하드웨어에 맞지 않는 드라이버) 또는 하드웨어 문제로 인해 발생할 수 있습니다.

귀하의 경우, 문제가 반복 가능하지 않다면 하드웨어 문제일 가능성이 높습니다.
그리고 그것은 기억일 수도 있습니다(나쁜 기억이 항상 식별하기 쉬운 것은 아닙니다).

서버를 부팅하고 grub 화면(부팅 직후)에서 "memtest86" 옵션을 선택합니다. 메모리 테스트는 며칠 동안 계속해서 실행되어야 합니다.
3일 후에도 오류가 없으면 메모리는아마도좋아요.

답변2

다른 정보가 없다면(ring0이 말했듯이 정보는 디스크 어딘가에 저장되지 않습니다), 할 수 있는 다른 일은 없습니다.

사전 대응을 원하거나 무작위로 몇 번 더 발생하는 경우 LKCD를 사용하여 코어 덤프를 캡처할 수 있습니다. http://lkcd.sourceforge.net/

RAM이 얼마나 있는지는 모르지만 몇 시간 동안 memtest86을 사용해 보는 것도 도움이 될 수 있습니다. 분명 아주 드문 오류는 포착하지 못할 것입니다.

또한 kernel.panic=5 /etc/sysctl.conf를 추가하는 것이 좋습니다. 커널이 다시 멈추면 5초 후에 서버가 자동으로 재부팅됩니다.

마지막으로 항상 일종의 소등 관리가 필요하다고 생각합니다. 그런 다음 로그인하여 메시지를 복사하고 서버를 직접 다시 시작할 수 있습니다.

답변3

서버가 장기간에 걸쳐 너무 높은 로드/너무 많은 프로세스로 실행될 때 이러한 충돌이 발생하는 것을 본 적이 있습니다. 귀하의 컴퓨터에서 무슨 일이 일어나고 있는지 일반적으로 확인하려면 서버에 munin과 같은 모니터링 프레임워크를 설치하는 것이 좋습니다. 이는 이러한 일이 다시 발생할 경우 분석에 도움이 됩니다.

답변4

다소 이상하게 들릴 수도 있지만 64비트 서버에서 실행되는 Ubuntu x64에 문제가 있었습니다. 나는 이와 같은 오류와 그에 따른 "정지" 문제를 매우 자주 겪었습니다. 드라이버를 제거하고, 다시 드라이버를 추가하고, 버그를 조사하는 데 몇 시간을 보냈지만 아무 도움도 되지 않았습니다. 마침내 32비트 버전의 Ubuntu를 설치하여 문제를 해결했습니다. 작동했고 64비트가 필요하지 않았기 때문에 그대로 두었습니다. 64비트가 필요한 경우 이는 좋은 솔루션이 아니지만 조금 더 탐색할 수 있는 길을 제공할 수 있습니다. Ubuntu를 실행 중인 서버를 찾아보고 그 주변에 알려진 호환성 문제가 있는지 확인할 수도 있습니다. 행운을 빌어요.

관련 정보