
이전 질문에서 LinuxDevOps로부터 훌륭한 조언을 얻었지만 부분적으로 무시하기로 결정했습니다. 더 나쁜 일이 일어났는데, 이유도, 원인을 조사하는 방법도 모르겠습니다.
Ubuntu Server 13.10을 실행하는 전용 서버가 있습니다.
재부팅이 필요한 커널 업데이트가 있어서 일주일간 방치하다가 토요일 밤 2시에 지금 sudo 재부팅 -r을 사용하여 재부팅했습니다. 서버가 다시 돌아오지 않았습니다. 더 이상 SSH를 통해 연결할 수 없거나 HTTP를 통해 Apache에 연결할 수 없습니다.
제가 문을 닫았을 때 데이터 센터를 구출해야 했습니다. 그들이 돌아온 것은 그들이 방금 서버를 재부팅했고 모든 것이 괜찮았다는 것입니다. 그런 다음 저는 다시 온라인 상태가 되었습니다.
이제 저는 어려운 방법을 배웠으며 LinuxDevOps가 그의 대답에서 1번을 강조한 것이 옳았습니다. 건너뛸 수도 있다는 뜻밖의 예방 조치로 삼았습니다...
무엇이 잘못되었는지 어떻게 조사할 수 있나요?
지금은 서버를 다시 재부팅할 수 없습니다. 서버가 반복되지 않을 것이라고 제안할 것이 없기 때문입니다.
감사해요.
Apr 6 02:20:24 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 02:20:34 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 03:38:13 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpuset
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpu
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpuacct
etc... normal startup
따라서 이것은 처음 두 항목이 특정 지점으로 부팅하려는 시도처럼 보이고 한 시간 후에 데이터 센터가 재부팅했을 때 정상적인 시작으로 보이는 것을 보여줍니다. 이는 /var/log/kern.log에서 가져온 것입니다.
감사해요.
답변1
지금 할 수 있는 유일한 일은 로그에서 발생한 문제와 관련된 정보를 찾는 것입니다. 음, 그게 다야.