MCE 오류 코드/분홍색 화면 - 문제의 원인이 되어야 합니까?

MCE 오류 코드/분홍색 화면 - 문제의 원인이 되어야 합니까?

그래서 최근에 모든 서버급 주변 장치와 함께 서버급 시스템을 구입했습니다. ESXi 6 라이센스가 있고 최신 패치가 모두 설치되어 있습니다. 시스템이 약 2주 동안 실행되고 있었는데 갑자기 완전한 충돌이 발생했습니다.

저는 이 오류 코드를 "내부 타이머 오류"로 해석했습니다. SuperMicro에 정보를 전달했지만 솔직히 말해서 지금까지는 그들의 반응에 그다지 확신이 없습니다. 내 해석은 ESXi를 실행하는 ECC 메모리가 있는 Xeon이기 때문에 시스템이 단순히 충돌해서는 안 된다는 것이었습니다.

이것이 일회성 오류였으며 다시는 발생하지 않아야 할 가능성이 있습니까? 이 문제를 어떻게 처리하시겠습니까? 이러한 유형의 오류를 본 사람들로부터 조언을 구하고 실제로 어떤 일을 하게 되었는지 알아보세요.

충돌

답변1

ECC RAM이 있기 때문에 이 오류(MCE, 기계 검사 예외)가 표시됩니다.

어딘가에 손상된 하드웨어가 있습니다. 메모리 스틱일 가능성이 높지만 하나 이상의 프로세서(아마도 CPU 10?) 또는 그 사이에 있을 수도 있습니다. 지원 계약을 호출합니다.

하드웨어의 다른 비트일 수도 있지만 이것을 볼 때마다 다중 비트 오류가 발생하는 ECC RAM에 결함이 있었습니다. MCE가 "내부 타이머 오류"로 디코딩된 경우 다음으로 가능성이 가장 높은 것은 결함이 있는 CPU 또는 메인보드입니다.

답변2

네, 우려할 만한 일입니다. 서버가 터졌어요!

RAM과 CPU 소켓 핀을 확인하십시오(서버를 직접 조립한 경우).

이것이 당신이 얻게 될 모든 정보에 관한 것입니다. VMware에 지원 사례를 열면 VMware에서 크래시 덤프를 분석해 드립니다.

관련 정보