저는 Linode에서 Ubuntu 16.04.3 LTS 상자를 실행하고 있습니다. 이 상자는 활용도가 매우 낮지만 가동 시간 모니터에 따르면 내 사이트가 다시 작동하기 전에 거의 한 시간 동안 다운되었다고 합니다. 확인해 보니 서버가 재부팅되었고 바로 사이트가 복구되었습니다. Linode로부터 다음과 같은 이메일을 받았습니다 Host initiated restart
. 높은 사용량 임계값에 대한 Linode 내부의 경고 설정도 실행되지 않았습니다.
무슨 일이 일어났는지 알아내려고 노력 중이에요. 나는 Linode가 있는 또 다른 Ubuntu 실행 상자에서 문제를 보았습니다. Linode 지원팀은 Linode가 충돌을 일으키고 Lassie(그들의 감시자)가 재부팅했다고 말했는데, 이것이 바로 여기서 일어난 것 같습니다.
/var/log/auth.log
& 를 모두 확인했지만 가동 중지 시간 사이 의 /var/log/syslog
로그 항목이 누락된 것 같습니다 . 그렇게 눈에 띄는 메시지는 없습니다. 내 서버에 로그 가 없습니다 .18:03
18:57
/var/log/messages
내용 /var/log/syslog
:
Feb 23 18:03:04 localhost alertyo-engine[6279]: Un-Setting flag
Feb 23 18:03:04 localhost alertyo-engine[6279]: Alloc = 1 MiB#011TotalAlloc = 2470 MiB#011HeapAlloc = 1 MiB#011Sys = 10 MiB#011NumGC = 10856
Feb 23 18:57:14 localhost rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="3304" x-info="http://www.rsyslog.com"] start
Feb 23 18:57:14 localhost rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's groupid changed to 108
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's userid changed to 104
Feb 23 18:57:14 localhost systemd[1]: Mounted FUSE Control File System.
내용 /var/log/auth.log
:
Feb 23 18:03:01 localhost CRON[29814]: pam_unix(cron:session): session closed for user root
Feb 23 18:03:01 localhost CRON[29813]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:57:14 localhost CRON[3301]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:57:15 localhost systemd-logind[3312]: Watching system buttons on /dev/input/event0 (Power Button)
Feb 23 18:57:15 localhost systemd-logind[3312]: New seat seat0.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on 0.0.0.0 port 22.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on :: port 22.
Feb 23 18:57:16 localhost CRON[3301]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:58:01 localhost CRON[3680]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session closed for user ashfame
또 무엇을 확인할 수 있나요? 이것이 반복되는 문제라면 무엇이 잘못되었는지 파악하기 위해 더 많은 로깅 항목을 설정할 수 있었을 것입니다. 그러나 지난번(다른 상자에 있었던)과 마찬가지로 이것이 몇 달에 한 번 발생하는 것 같습니다. 그런 일이 다시 일어날 때를 대비하기보다 무슨 일이 일어났는지 어떻게 알 수 있나요?
답변1
이 문제가 Linode의 Fermont 데이터 센터의 정전으로 인해 발생했다는 사실을 방금 알게 되었습니다.
따라서 이러한 문제에 대해 서버 로그에 아무 것도 표시되지 않으면 서버의 전원이 방금 꺼져서 로그에 아무 것도 표시되지 않았기 때문일 수 있습니다(일부 시스템에서 읽을 수 있는 내용을 읽은 기억이 납니다).
항상 제공업체의 상태 페이지와 트위터 검색을 확인하는 것이 좋습니다. :)