Конфигурация — это то, что я унаследовал, но соединение от LoadMaster к двум серверам приложений иногда прерывается. Это происходит с каждым сервером независимо и, похоже, происходит только в периоды низкой нагрузки.
При записи дампов TCP я вижу рукопожатие ACK, отправленное с сервера приложений на LoadMaster, но оно никогда не достигает пункта назначения. При запуске traceroute с использованием TCP во время сбоя он направляет первый прыжок через шлюз по умолчанию и в итоге заканчивается тайм-аутом, если соединение работает, он просто направляет напрямую на LoadMaster.
Стандартный traceroute с использованием ICMP никогда не дает сбоев и не истекает по времени, но в конечном итоге маршрутизируется через шлюз по умолчанию, когда TCP отображается как истекший по времени. Если я отключаю/включаю что-либо на LoadMaster, соединение восстанавливается, и traceroute больше не маршрутизирует через шлюз по умолчанию, но только на короткое время, если громкость низкая и снова падает.
Я предполагаю, что проблема либо в сети, либо в LoadMaster, но не знаю дальнейших шагов по устранению неполадок, чтобы точно определить ее (я большую часть жизни был программистом и только время от времени занимался сетевыми вопросами), и, похоже, это выше понимания тех сетевых специалистов, с которыми я работаю.