ハード ドライブの障害により Exchange 2003 サーバーを再構築した後、不明な時間が経過すると Exchange が使用できなくなります。現在、ユーザーの大多数は Outlook 2007 を使用しています (少数は依然として 2003 を使用しています)。
ログレベルを上げて、これらの警告に気付きました。追跡してみたところ、15 分ごとに発生しているようです (時間枠が関係しているかどうかはわかりません)
これらの警告は時々エラーにつながるため、昨日はサーバーを 2 回再起動しました。午前 8:30 頃と午後 2:30 頃です (約 6 時間 - タイミングが関係しているかどうかはわかりません)。
プロセス INETINFO.EXE (PID=1300)。エラー 0x80040951 のため、DSAccess はドメイン コントローラー AD-server.domain.com への接続を閉じる必要があります。
プロセス STORE.EXE (PID=2936)。エラー 0x80040952 のため、DSAccess はドメイン コントローラー AD-server.domain.com への接続を閉じる必要があります。
プロセス MAD.EXE (PID=2160)。エラー 0x80040952 のため、DSAccess はドメイン コントローラー AD-server.domain.com への接続を閉じる必要があります。
3 つの警告はそれぞれ約 15 分ごとに再発します。
Exchangeを再起動する前に表示されるエラーは次のようになります
識別名 '' のディレクトリ AD-server.domain.com で LDAP バインドが失敗しました。ディレクトリがエラーを返しました: [0x51] サーバーがダウンしています。DC=domain、DC=com
警告がエラー (そして最終的にはその後の再起動) と関係があるかどうかはわかりません。上記のタイミングから、午後 8:30 頃と午前 2:30 頃に再び発生すると考えましたが、何も起こりませんでした。昨日の午後 2:30 頃の再起動以降、エラーは発生していません。
DMZ 1
Exchangeと AD は有効ですDMZ 3
が、ファイアウォール (Sonicwall) は 2 つの DMZ 間で完全に開いていることに注意してください。
Exchange は以前は独自のサーバー上にありましたが、一部の技術者の推奨により、VM に移行しました。2008 サーバーがホストで、VM 用の VMWare サーバー 2 と、2003 Exchange を実行する Windows 2003 です。
何が起こっているのか本当にわかりません。ファイアウォールを再起動し、AV/コンテンツ フィルタリングをオフにし、AD と Exchange の両方を再起動しました。
Exchange を AD と同じ DMZ に移動することを検討しています。私たちが話したすべての人がそれを推奨していますが、まだ実行できません。一番良い点は、Exchange を再構築するまで、同じファイアウォール、同じ DMZ 設定、同じ OS バージョン (VM を除く) で 3 年以上も問題なく動作していたことです。Exchange が失われ、再構築しなければならなくなった後、初めてこれらの問題が発生しました。
何か案は?
--- メモ追加 11-23-11 11:11am EST --- @ Even Anderson
あなたにお願いされたことをどうやって実現すればいいのか、よくわかりませんでした。通常、ここではトラフィックをスニッフィングしません...
そこで、Sonicwall NSA にパケット キャプチャ機能が組み込まれていることを思い出しました。
そこで、Exchange サーバーと AD サーバーを入力し、キャプチャを PC 上の FTP サーバーに送信して、Exchange と AD 間のトラフィックを監視できるようになりました。送信された .cap ファイルは、Wireshark で表示できます。
「問題」は今朝午前 1 時から 3 時の間に発生し、今朝午前 9 時頃にも再び発生しました。安全のため午前 6 時頃に出社したときに再起動し、午前 9 時 30 分頃に Exchange が応答しなくなったときに再度再起動しました。
LDAP プロトコルをフィルタリングすると、次のエントリが表示されます。
SASL GSS-APIの不正確さ - これらは実際の検索のように見え、すべてのsearchRequestにはsearchResEntryがあります。
bindRequest と bindResponse は 1 対 1 のように見えるので、問題ないようです。
Exchange から AD への unbindRequest がいくつか表示されていますが、応答がないようです。ただし、応答があるかどうかはわかりません。
実際の SYNC が含まれているものは何も見当たりません。
まだ調査中です - キャプチャを実行してもパフォーマンスには影響がないように思われるので、エラーが発生して Exchange が応答しなくなるまで実行を継続したいと思います。
答え1
エラー 0x80040951 は「LDAP_SERVER_DOWN」エラーであり、0x80040952 は「LDAP_LOCAL_ERROR」です。どちらも、Exchange Server コンピューターが LDAP 経由で DC と通信できなくなっていると考えられます。
まず、Exchange と DC 間のトラフィックをスニッフィングします。可能であれば、SPAN ポートまたはその他の方法を使用して、DC と Exchange の間に専用のスニッファ コンピュータを「ティー」接続し、どちらのサーバーでもパフォーマンスの問題を起こさずに長期的なスニッフィングを実行できるようにします。キャプチャ フィルタを使用して、Exchange Server と DC 間の会話へのトラフィックを分離できます。可能であれば、2 台のコンピュータを使用してスニッフィングし、各サーバーとそれらを分離するファイアウォール デバイスの間に 1 台ずつ「ティー」接続します。
実際のネットワーク トラフィックで何が起こっているかがわからないため、これ以上の推奨事項を提示することは困難です。障害の「発生中」のキャプチャをいくつか取得できた場合は、ここに投稿していただければ確認します。これまでのところ、Exchange Server コンピュータが DC の LDAP ポートに対して繰り返し SYN を実行していて、応答がないことが分かると思います。ファイアウォール デバイスの「両側」からキャプチャできるほど幸運であれば、ファイアウォールを通過していないトラフィックが見つかるでしょう。あなたの問題は確かにそのように感じられます...