Centos サーバーに接続する Kemp LoadMaster を使用した 2 アーム負荷分散環境での TCP 接続の切断

Centos サーバーに接続する Kemp LoadMaster を使用した 2 アーム負荷分散環境での TCP 接続の切断

この構成は私が継承したものですが、LoadMaster から 2 つのアプリケーション サーバーへの接続が時々切断されてしまいます。これは各サーバーで個別に発生し、低ボリューム期間にのみ発生するようです。

TCP ダンプを記録すると、アプリケーション サーバーから LoadMaster に送信されたハンドシェイク ACK を確認できますが、宛先に到達しません。障害発生時に TCP を使用して traceroute を実行すると、最初のホップがデフォルト ゲートウェイを経由してルーティングされ、タイムアウトになります。接続が機能している場合は、LoadMaster に直接ルーティングされます。

ICMP を使用する標準の traceroute は失敗したりタイムアウトしたりすることはありませんが、TCP がタイムアウトとして表示される場合は、デフォルト ゲートウェイ経由でルーティングされます。LoadMaster で何かを無効/有効にすると、接続が復元され、traceroute はデフォルト ゲートウェイ経由でルーティングされなくなりますが、ボリュームが少ない場合は短時間だけルーティングされ、再び失敗します。

問題はネットワークか LoadMaster のどちらかにあると推測しますが、問題を特定するための次のトラブルシューティング手順がわかりません (私は人生のほとんどをプログラマーとして過ごし、ネットワーク関連のことは少ししか知りませんでした)。また、これは私が一緒に働いているネットワーク担当者の手に負えない問題のようです。

関連情報