
ロードバランサーを使用して EC2 でホストされている複数のノード Web サーバーがあり、リクエストがサーバーに到達する前でも一部のユーザーに 502 が返されます。
サーバー内にこれらのリクエストのログがないので、リクエストがサーバーに届かないものと想定しています。
以前にも同様の問題があり、ノード構成に をkeepAliveTimeout
追加する必要がありました。headersTimeout
毎日、日中に不健全なインスタンスがいくつか発生しますが、それが発生する時間は 502 エラーの発生時間と必ずしも一致するわけではありません。ヘルス チェックのタイムアウトを 5 秒から 10 秒に増やして、何が起こるか確認したほうがよいでしょうか。
メモリとCPUの使用率は問題ないようです。
この問題をデバッグする方法についてのヒントはありますか?
答え1
答えはすでにご存知でしょう。インスタンスが不健全です。時間が一致しない場合でも、その問題を修正し、その後も他の問題が続くかどうかを確認する必要があります。
インスタンスサイズを増やし、ELBヘルスチェックのタイムアウトを増やし、マシンをスケールアップして、それが役立つかどうかを確認します。