HAProxy, тайм-ауты клиента при подключении из пула JDBC

Question

Единственный способ получить больше информации от haproxy, чем та, что у вас есть, — это периодически использовать команду show sessили show sess <id>для просмотра состояния каждого tcp-соединения, хотя я не уверен, получите ли вы больше полезной информации.

Состояние cDзавершения — самая полезная информация, которая у вас есть. Что это значит на самом деле, так это то, что установленное соединение с клиентом истекло. Это контролируется в haproxy через timeout clientпараметр в конфигурации, установленный глобально или в разделе frontent или listen.

Вы сказали, что не видите, чтобы число одновременных подключений превышало 7, а эта запись в журнале показывает, что сбой произошел, когда было всего 3 подключения, поэтому я сомневаюсь, что у вас проблема с ограничением количества подключений (даже вне контроля haproxy).

Итак, похоже, что это происходит, так это то, что время от времени пул добавляет новое соединение, которое обрабатывает некоторые запросы, а затем простаивает. Когда это соединение простаивает дольше, чем установлено timeout clientв haproxy, haproxy завершит само соединение. В следующий раз, когда это соединение будет использовано из пула, вы получите указанную выше ошибку.

У Haproxy тайм-аут по умолчанию составляет 10 секунд (а в примерах конфигураций, я думаю, 50 секунд). Я не слишком хорошо знаком с JDBC, но, судя по документации Tomcat, есть настройка minEvictableIdleTimeMillis, которая исключает неактивные соединения из пула, и по умолчанию она составляет 60 секунд, и может быть до 65 секунд, поскольку timeBetweenEvictionRunsMillisпо умолчанию она составляет 5 секунд. По сути, вам нужно убедиться, что тайм-аут haproxy достаточно высок, чтобы учитывать эти неактивные соединения в пуле.

Другой подход — использовать testWhileIdleи valildationQueryподдерживать активные соединения, поскольку несколько пакетов трафика каждые несколько секунд, вероятно, также решат проблему.

[править] В ответ на дополнительную информацию @quanta:

Несмотря на то, что время ожидания haproxy теперь составляет 75 секунд, вы определенно все еще получаете тайм-ауты сеанса. Возможно, есть некоторая дополнительная игра в общем времени жизни соединения JDBC, о которой я не знаю. Поскольку для этого типа сервиса требуется очень мало соединений, нет ничего плохого в увеличении времени ожидания до чего-то чрезвычайно большого, порядка часа или больше. Если пул JDBC действительно испытывает проблемы с освобождением старых соединений, это будет только маскировкой проблемы, но это также может быть простым решением.

Answer 1

Единственный способ получить больше информации от haproxy, чем та, что у вас есть, — это периодически использовать команду show sessили show sess <id>для просмотра состояния каждого tcp-соединения, хотя я не уверен, получите ли вы больше полезной информации.

Состояние cDзавершения — самая полезная информация, которая у вас есть. Что это значит на самом деле, так это то, что установленное соединение с клиентом истекло. Это контролируется в haproxy через timeout clientпараметр в конфигурации, установленный глобально или в разделе frontent или listen.

Вы сказали, что не видите, чтобы число одновременных подключений превышало 7, а эта запись в журнале показывает, что сбой произошел, когда было всего 3 подключения, поэтому я сомневаюсь, что у вас проблема с ограничением количества подключений (даже вне контроля haproxy).

Итак, похоже, что это происходит, так это то, что время от времени пул добавляет новое соединение, которое обрабатывает некоторые запросы, а затем простаивает. Когда это соединение простаивает дольше, чем установлено timeout clientв haproxy, haproxy завершит само соединение. В следующий раз, когда это соединение будет использовано из пула, вы получите указанную выше ошибку.

У Haproxy тайм-аут по умолчанию составляет 10 секунд (а в примерах конфигураций, я думаю, 50 секунд). Я не слишком хорошо знаком с JDBC, но, судя по документации Tomcat, есть настройка minEvictableIdleTimeMillis, которая исключает неактивные соединения из пула, и по умолчанию она составляет 60 секунд, и может быть до 65 секунд, поскольку timeBetweenEvictionRunsMillisпо умолчанию она составляет 5 секунд. По сути, вам нужно убедиться, что тайм-аут haproxy достаточно высок, чтобы учитывать эти неактивные соединения в пуле.

Другой подход — использовать testWhileIdleи valildationQueryподдерживать активные соединения, поскольку несколько пакетов трафика каждые несколько секунд, вероятно, также решат проблему.

[править] В ответ на дополнительную информацию @quanta:

Несмотря на то, что время ожидания haproxy теперь составляет 75 секунд, вы определенно все еще получаете тайм-ауты сеанса. Возможно, есть некоторая дополнительная игра в общем времени жизни соединения JDBC, о которой я не знаю. Поскольку для этого типа сервиса требуется очень мало соединений, нет ничего плохого в увеличении времени ожидания до чего-то чрезвычайно большого, порядка часа или больше. Если пул JDBC действительно испытывает проблемы с освобождением старых соединений, это будет только маскировкой проблемы, но это также может быть простым решением.

HAProxy, тайм-ауты клиента при подключении из пула JDBC

решение1

Связанный контент