![mdadm이 디스크를 떨어뜨린 이유를 찾아보세요](https://rvso.com/image/169427/mdadm%EC%9D%B4%20%EB%94%94%EC%8A%A4%ED%81%AC%EB%A5%BC%20%EB%96%A8%EC%96%B4%EB%9C%A8%EB%A6%B0%20%EC%9D%B4%EC%9C%A0%EB%A5%BC%20%EC%B0%BE%EC%95%84%EB%B3%B4%EC%84%B8%EC%9A%94.png)
지난 한두 달 동안 mdadm이 디스크를 두 번 삭제하도록 했습니다. 지난번에 다시 추가했는데 한동안 괜찮게 실행되다가 다시 성능 저하 모드로 실행되는 것을 발견했습니다. 드라이브를 떨어뜨린 "이유"를 어떻게 찾는지 궁금했습니다.
답변1
시스템 로그(일반적으로 /var/log/messages
및/또는 명령 출력) 를 읽어야 합니다 journalctl -xe
. 최근 드라이브에 오류가 발생한 경우 커널 메시지 버퍼(명령으로 볼 수 있음 dmesg
)에도 이에 대한 메시지가 있을 수 있습니다.
일반적으로 dmesg
메시지는 로그에도 저장되지만, 우선순위가 낮은 커널 메시지 중 일부를 무시하도록 로깅 하위 시스템이 구성되었을 수 있으므로 출력에 더 자세한 내용이 있을 수 있습니다 dmesg
.
여러분이 보게 될 것은 디스크 I/O 오류/시간 초과 메시지와 그 사이 또는 그 뒤에 드라이브를 실패로 표시하는 RAID 하위 시스템의 메시지입니다. 기본적으로 RAID 하위 시스템이 어떤 이유로든 디스크가 I/O(읽기 또는 쓰기) 요청 실패 또는 시간 초과를 보고하기 시작하는 것을 감지하면 디스크는 실패한 것으로 표시됩니다.
더 많은 단서를 얻으려면 떨어뜨린 디스크를 사용하여 smartctl -a
자체 내부 상태 검사에서 어떤 결과가 보고되는지 확인할 수도 있습니다.