Postgresql atrás de firewall: a consulta demora muito

Question 1

Algumas coisas para tentar:

Comece verificando se sua rede está se comportando bem. Supondo que você tenha gerenciado switches, observe as estatísticas da interface para incompatibilidade de velocidade/duplex ou MTU incompatível. Considere verificar/substituir o cabeamento se algo estiver apresentando erros (por exemplo: tentar executar GigE sobre Cat5 em vez de Cat5e provavelmente causará sofrimento).
Execute alguns testes para provar que você pode obter transferências wire-speed entre as duas máquinas e para a máquina externa; As transferências netcat, ftp ou http são um bom começo aqui (o scp pode ficar vinculado à CPU e, portanto, pode não ser o melhor teste).
Teste a mesma consulta localmente no servidor Postgres. Se for concluído em um prazo apropriado, você sabe que não é o banco de dados. Se não for concluído ou demorar "muito", você terá uma consulta incorreta ou outro problema de banco de dados para depurar. Certifique-se de considerar o lado de E/S de armazenamento; você pode estar saturando o que seus discos são capazes de fornecer. Verifique os gráficos de desempenho do VMware para confirmar/negar.
Supondo que funcione, desative o firewall e execute a mesma consulta no servidor postgres da "caixa1". Se isso funcionar, a conectividade VM-> VM provavelmente estará correta.
Supondo que funcione, reative o firewall e teste novamente. Se isso funcionar, então o seu problema provavelmente é externo a esse host, deixando o switch ou o host externo para depurar.

Boa sorte.

Answer

Algumas coisas para tentar:

Comece verificando se sua rede está se comportando bem. Supondo que você tenha gerenciado switches, observe as estatísticas da interface para incompatibilidade de velocidade/duplex ou MTU incompatível. Considere verificar/substituir o cabeamento se algo estiver apresentando erros (por exemplo: tentar executar GigE sobre Cat5 em vez de Cat5e provavelmente causará sofrimento).
Execute alguns testes para provar que você pode obter transferências wire-speed entre as duas máquinas e para a máquina externa; As transferências netcat, ftp ou http são um bom começo aqui (o scp pode ficar vinculado à CPU e, portanto, pode não ser o melhor teste).
Teste a mesma consulta localmente no servidor Postgres. Se for concluído em um prazo apropriado, você sabe que não é o banco de dados. Se não for concluído ou demorar "muito", você terá uma consulta incorreta ou outro problema de banco de dados para depurar. Certifique-se de considerar o lado de E/S de armazenamento; você pode estar saturando o que seus discos são capazes de fornecer. Verifique os gráficos de desempenho do VMware para confirmar/negar.
Supondo que funcione, desative o firewall e execute a mesma consulta no servidor postgres da "caixa1". Se isso funcionar, a conectividade VM-> VM provavelmente estará correta.
Supondo que funcione, reative o firewall e teste novamente. Se isso funcionar, então o seu problema provavelmente é externo a esse host, deixando o switch ou o host externo para depurar.

Boa sorte.

Question 2

Você está tendo um problema de MTU, mas não sei por quê. Estou tentando entender sua topologia virtual aqui.

Então, seu notebook Windows Vista está conectado à rede "local" ou à rede Internet?

Presumo que seu notebook Windows Vista esteja conectado à Internet e que você esteja acessando o endereço IP externo da "caixa 1" para usar o encaminhamento de porta na porta 5432 para chegar à "caixa 2". Se for esse o caso, o que você ganha quando tenta:

ping -l 1472 -f <endereço IP da caixa 1>

Editar: Ok - muito bom. Se desejar, execute um "ifconfig" na "caixa 1" e na "caixa 2" e examine o valor MTU em cada interface Ethernet. Eles deveriam ser todos 1500. (Estou apenas tentando entender por que a "caixa 1" disse à "caixa 2" que não poderia fragmentar um datagrama de 556 bytes vinculado ao seu notebook ...)

Editar: Zow. Ok - isso é selvagem.

Se não for pedir muito, você poderia postar o conteúdo (ou links para ele) das configurações do seu iptables na pergunta? (Estou começando a ficar perplexo aqui. O que você está descrevendo é algo que tenho feito com frequência, mas não tenho certeza de como está falhando.)

Editar: De volta com você agora. OK. Estou ficando perplexo com isso agora. A configuração do iptables não parece estar causando problemas. Vejo que você está encaminhando o UDP 5432 para a "caixa 2". Você não precisa encaminhar isso - o Postgres usa apenas TCP. Isso não vai doer nada, no entanto.

Durante sua espera de 20 minutos, você viu tráfego circulando entre o notebook Vista e a "caixa 2"? Você consegue reproduzir essa condição toda vez que se conecta?

Não que isso faça uma grande diferença, mas na cadeia FORWARD na "caixa 1", eu normalmente faria a regra de que ACEITA pacotes com RELATED,ESTABLISHED definido como a primeira regra na cadeia (para processamento de curto-circuito). Não acho que isso teria algum impacto significativo no desempenho para você.

Odeio não saber a resposta para um problema. Isso vai me manter acordado à noite.

Answer