Exchange 2003에서 오류가 다시 발생하여 사용할 수 없게 되고 재부팅됩니까?

Exchange 2003에서 오류가 다시 발생하여 사용할 수 없게 되고 재부팅됩니까?

하드 드라이브 오류로 인해 Exchange 2003 서버를 재구축한 후 알 수 없는 시간이 지나면 Exchange를 사용할 수 없게 됩니다. 대다수의 사용자는 현재 Outlook 2007을 사용하고 있습니다(2003에서는 여전히 소수).

우리는 로깅 수준을 높였고 이제 이러한 경고를 확인했습니다. 추적해 보니 대략 15분마다 발생하는 것 같습니다(시간 범위가 그것과 관련이 있는지 확실하지 않음).

이러한 경고는 때때로 오류로 이어지며 어제 우리는 서버를 두 번 재부팅했습니다. 오전 8시 30분과 오후 2시 30분경(약 6시간 - 다시 말하지만 타이밍이 관련이 있는지 확실하지 않음)

INETINFO.EXE(PID=1300)를 처리합니다. DSAccess는 오류 0x80040951로 인해 도메인 컨트롤러 AD-server.domain.com에 대한 연결을 닫아야 합니다.

STORE.EXE를 처리합니다(PID=2936). DSAccess는 오류 0x80040952로 인해 도메인 컨트롤러 AD-server.domain.com에 대한 연결을 닫아야 합니다.

MAD.EXE를 처리합니다(PID=2160). DSAccess는 오류 0x80040952로 인해 도메인 컨트롤러 AD-server.domain.com에 대한 연결을 닫아야 합니다.

3가지 경고는 각각 15분마다 다시 발생합니다.

교환을 재부팅하기 전에 발생하는 오류는 다음과 같습니다.

고유 이름 ''에 대한 AD-server.domain.com 디렉터리에서 LDAP 바인딩에 실패했습니다. 디렉터리에서 오류를 반환했습니다:[0x51] 서버가 다운되었습니다. DC=도메인,DC=com

경고가 오류(궁극적으로는 그에 따른 재부팅)와 관련이 있는지 확실하지 않습니다. 위의 타이밍으로 우리는 오후 8시 30분과 오전 2시 30분쯤에 다시 일어날 것이라고 생각했지만 아무 일도 일어나지 않았습니다. 어제 오후 2시 30분쯤 재부팅한 이후로 오류는 없습니다.

Exchange가 있고 DMZ 1AD가 있지만 DMZ 3방화벽(Sonicwall)은 2개의 DMZ 사이에 완전히 열려 있습니다.

Exchange는 자체 서버에 있었지만 일부 기술자의 권장 사항에 따라 이후 VM으로 옮겼습니다. 2008 서버는 2003 Exchange를 실행하는 VM 및 Windows 2003의 호스트인 VMWare 서버 2입니다.

우리는 무슨 일이 일어나고 있는지 정말 당황스럽습니다. 방화벽을 재부팅하고 AV/컨텐츠 필터링을 끄고 AD와 Exchange를 모두 재부팅했습니다.

우리는 Exchange를 AD와 동일한 DMZ로 옮기는 것을 고려하고 있습니다. 우리와 대화하는 모든 사람이 이를 권장하지만 아직은 그렇게 할 수 없습니다. 가장 좋은 점은 Exchange를 재구축할 때까지 3년 이상 동안 동일한 방화벽, 동일한 DMZ 설정, 동일한 OS 버전(VM 제외)을 완벽하게 실행했다는 것입니다. Exchange를 잃어버리고 재구축해야 했던 후에야 이러한 문제가 발생했습니다.

어떤 아이디어가 있나요?

--- 메모 추가됨 11-23-11 오전 11:11 EST --- @ Even Anderson

나는 당신이 나에게 요청한 일을 어떻게 성취할 수 있을지 완전히 확신하지 못했습니다. 우리는 보통 여기서 교통 상황을 감지하지 않습니다 ...

그러다가 Sonicwall NSA에 패킷 캡처 기능이 내장되어 있다는 것을 기억했습니다.

그래서 Exchange 서버와 AD 서버를 입력하고 내 PC의 FTP 서버로 캡처를 보내면 이제 Exchange와 AD 간의 트래픽을 볼 수 있습니다. Wireshark로 보고 있는 .cap 파일을 나에게 보냅니다.

"문제"는 오늘 아침 1시에서 3시 사이에 발생했고, 오늘 아침 9시쯤에 다시 발생했습니다. 안전을 위해 오전 6시쯤 들어왔을 때 재부팅했고, 오전 9시 30분쯤 교환이 응답하지 않을 때 다시 재부팅했습니다.

LDAP 프로토콜을 필터링하면 다음 항목이 표시됩니다.

SASL GSS-API Inegrity - 실제 조회와 유사하며 모든 searchRequest에는 searchResEntry가 있습니다.

바인딩요청과 바인딩응답 - 이것들은 1대1로 보입니다. 그래서 괜찮아 보입니다.

응답이 없는 것처럼 보이는 Exchange에서 AD로의 unbindRequest가 표시됩니다. 그래도 응답이 있어야 하는지 잘 모르겠습니다.

실제 SYNC가 포함된 내용은 아무것도 표시되지 않습니다.

여전히 찾고 있습니다. 캡처를 실행해도 어디에서나 성능에 영향을 미치지 않으므로 오류가 발생하고 교환이 응답을 멈출 때까지 계속 실행하기를 바랍니다.

답변1

오류 0x80040951은 "LDAP_SERVER_DOWN" 오류이고, 0x80040952는 "LDAP_LOCAL_ERROR"입니다. 이 두 가지 모두 Exchange Server 컴퓨터가 LDAP를 통해 DC와 통신할 수 없게 되는 것 같습니다.

Exchange와 DC 간의 트래픽을 스니핑하는 것부터 시작하겠습니다. 가능하다면 SPAN 포트나 다른 방법을 사용하여 DC와 Exchange 사이의 전용 스니퍼 컴퓨터에서 "티"하여 두 서버 모두에서 성능 문제를 일으키지 않고 장기간 스니핑을 실행할 수 있습니다. 캡처 필터를 사용하여 Exchange Server와 DC 간의 대화에 대한 트래픽을 격리할 수 있습니다. 가능하다면 두 대의 컴퓨터를 사용하여 각 서버와 서버를 격리하는 방화벽 장치 사이에 하나씩 스니핑하고 "티"하십시오.

실제 네트워크 트래픽에 어떤 일이 일어나고 있는지 확인하지 않고는 추가 권장 사항을 제시하기가 어렵습니다. "실제" 실패에 대한 일부 캡처를 얻은 경우 여기에 게시할 수 있으며 우리가 살펴보겠습니다. 지금까지 본 내용에 따르면 Exchange Server 컴퓨터가 DC의 LDAP 포트에 대해 반복적으로 SYN을 수행하고 응답을 받지 못하는 것을 발견할 것으로 예상됩니다. 방화벽 장치의 양쪽 "측면"에서 캡처할 수 있을 만큼 운이 좋다면 방화벽을 통과하지 않는 트래픽을 보게 될 것입니다. 당신의 문제는 확실히 그런 느낌을 가지고 있습니다 ...

관련 정보