
Estou executando um cluster de enxame com apenas 3 mestres. Tenho algumas portas expostas em vários serviços do enxame. E um serviço Nginx em execução em todos os três nós atua como um proxy reverso.
Quando inicio as pilhas, todas essas portas estão acessíveis e respondendo conforme o esperado. Mas depois de algum tempo, algumas dessas portas param de responder a alguns servidores e o Nginx começa a lançar 504 tempos limite. (ou seja, a porta 5000 está respondendo às solicitações do Mestre 1, mas não do Mestre 2 e 3, e a porta 6000 está respondendo às solicitações do Mestre 1 e 3, mas não do Mestre 2.
Estas são as saídas denmap -Pn 172.17.0.1
# Master 1
PORT STATE SERVICE
22/tcp open ssh
80/tcp open http
443/tcp open https
5000/tcp open upnp
6000/tcp open mmcc
# Master 2
PORT STATE SERVICE
22/tcp open ssh
80/tcp open http
443/tcp open https
5000/tcp filtered upnp
6000/tcp filtered mmcc
# Master 3
PORT STATE SERVICE
22/tcp open ssh
80/tcp open http
443/tcp open https
5000/tcp filtered upnp
6000/tcp open mmcc
A saída de netstat -lnpt | grep 5000
(igual em todos os 3 nós)
tcp6 0 0 :::5000 :::* LISTEN -
Não consigo descobrir se esse problema está relacionado ao docker swarm, ao Nginx ou à própria máquina host. Qualquer ajuda na depuração disso seria muito apreciada. Eu ficaria mais do que feliz em compartilhar mais informações, se necessário.
Desde já, obrigado.