3 台のサーバーのクラスター設定があり、3 台のサーバーすべてで Web サイトをホストするために Weblogic が実行されています。Weblogic の上部では、Apache をロード バランサーとして使用しています。
昨年、Apache http サーバーを 2.4.9 から 2.4.29 にアップグレードしました。アップグレード前は問題なく動作していましたが、アップグレード後は 2 ~ 4 週間ごとに Apache がハングします。Web サイトにアクセスできなくなります。サーバーをチェックしてもエラーは表示されません。実際、Apache がハングすると、ログも停止します。
問題が発生する前に監視したところ、異常なメモリ使用量、Web サイトへの疑わしい種類のリクエスト、疑わしいプロセスの実行は見つかりませんでした。
インターネットで調べた結果、問題は MPM 構成に関連している可能性があることがわかりました。Apache はイベント MPM を使用していましたが、イベント MPM 構成が Apache 構成で宣言されていないことがわかりました。アップグレード中にデフォルトの構成が古い構成に置き換えられたと思います。
そこで、以下のイベント MPM 構成を使用するように MPM 構成を変更し、この変更は機能しました。次の 6 か月間、この問題は発生しませんでした。
開始サーバー数 4 最小スペアスレッド数 256 最大スペアスレッド数 512 子スレッド数 64 最大リクエストワーカー数 2048 子接続数 0
問題は解決したと思っていましたが、6 か月後に Apache が再びハングアップし、確認できる症状は、次の 1 時間で closed_wait 接続が 20 から 550 に増加し、Web サイトにアクセスできなくなり、Apache が SSL およびエラー ログへのログ記録を停止したことです。実行中のさまざまなプロセス データやメモリ使用量に異常な動作は見られず、問題が発生する前に疑わしいリクエストも確認されていません。