Каковы возможные причины тайм-аутов на уровнях 4 и 7 в HAProxy?

Каковы возможные причины тайм-аутов на уровнях 4 и 7 в HAProxy?

Я копирую свой вопрос со Stackoverflow:https://stackoverflow.com/q/63683206/6344947

Я увидел, что получаю 503 для своего приложения, когда обращаюсь к API. Когда я проверил статистику HAProxy LB для своих экземпляров, я обнаружил, что один из них показывал тайм-аут уровня 4, а другой — тайм-аут уровня 7.

Скриншот статистики HAProxy LB: https://i.stack.imgur.com/6Vtnc.png

В экземплярах был запущен процесс Java, который действовал как бэкэнд-сервис. После перезапуска процесса я обнаружил, что все вернулось к норме.

Так есть ли способ выяснить, в чем может быть причина? Может ли это быть из-за проблем с нехваткой памяти? Я видел логи, но там не было ничего, связанного с OOM; кроме того, у нас были проблемы OOM в этом случае в прошлом - но в то время я не проверял статистику HAProxy.

Любая помощь будет оценена по достоинству.

решение1

Уровень 4 означает, что истекло время ожидания TCP-рукопожатий, возможно, сервер не работает? Уровень 7 означает, что истекло время ожидания HTTP-ответа, поэтому приложение работает (может быть, запускается?), прослушивает указанный порт и принимает TCP-подключения, но не предоставило HTTP-ответ вовремя. Возможно, оно все еще запускается? Некоторым приложениям Java требуются минуты для фактического запуска. Оба случая скорее указывают на проблему с бэкенд-приложением, а не на проблему с самим haproxy. Я бы сказал, что пора проверить логи этого приложения Java.

Связанный контент