
매달 VMware 4.1을 실행하는 서버 중 하나가 응답하지 않게 되었습니다. 백업할 수 있는 유일한 방법은 하드 재부팅을 수행하는 것이었습니다. 이런 일이 발생했을 때 VMware에 연결할 수 있었지만 정보를 탐색하고 보는 것 외에는 아무것도 할 수 없었습니다.
서버는 1TB SATA 디스크 2개와 Dell SAS 6/iR 어댑터 Raid 컨트롤러(디스크 미러링, 배터리 없음)를 갖춘 Dell PowerEdge R210입니다. 문제없이 실행되는 또 다른 동일한 서버가 있습니다.
이제 이 문제를 파악하기 위해 몇 가지 테스트를 수행할 수 있도록 서버를 교체했습니다. 지금까지 BIOS 및 Raid 컨트롤러 펌웨어를 업데이트하고, VMware를 다시 설치하고, 모든 RAM 모듈을 교체했지만 문제가 해결되지 않았습니다.
서버에 Ubuntu를 설치하려고 시도했지만 VMware를 실행할 때만 문제가 존재하지 않습니다.
이 문제는 현재 약 10번 발생했으며 디스크 로드가 많을 때 발생할 가능성이 더 높은 것으로 보입니다.
오류 메시지는 다음과 같습니다.
저장 장치 naa.600508e000000000a528c060b1275b09에 대한 연결이 끊겼습니다. vmhba1:C1:T0:L0 경로가 다운되었습니다. 영향을 받는 데이터 저장소: "", "datastore1", "Hypervisor1", "Hypervisor2", "Hypervisor3".
연결 문제로 인해 볼륨 50520233-c467e816-a5a1-0026b97a4010(datastore1)에 대한 액세스가 손실되었습니다. 복구 시도가 진행 중이며 결과가 곧 보고될 것입니다.
로그 항목은 다음과 같습니다.
답변1
SATA 디스크 시간 초과가 발생할 수 있습니다. 안 좋은 일이 있거나실패디스크.
PERC 컨트롤러에 배터리 지원 캐시가 있습니까?
보다:하드웨어 SATA RAID-10 어레이의 단일 디스크가 어떻게 전체 어레이를 갑자기 정지시킬 수 있습니까?