Postgresql hinter Firewall: Abfrage dauert zu lange

Question 1

Einige Dinge, die Sie ausprobieren können:

Überprüfen Sie zunächst, ob Ihr Netzwerk ordnungsgemäß funktioniert. Angenommen, Sie haben verwaltete Switches, überprüfen Sie die Schnittstellenstatistiken auf Geschwindigkeits-/Duplex-Fehlanpassungen oder eine nicht übereinstimmende MTU. Überprüfen bzw. ersetzen Sie die Verkabelung, wenn Fehler auftreten (z. B.: Der Versuch, GigE über Cat5 statt Cat5e auszuführen, wird wahrscheinlich Probleme verursachen).
Führen Sie einige Tests durch, um zu beweisen, dass Sie zwischen den beiden Maschinen und zur externen Maschine Übertragungen mit Kabelgeschwindigkeit durchführen können. Netcat-, FTP- oder HTTP-Übertragungen sind hier ein guter Anfang (SCP wird möglicherweise CPU-gebunden und ist daher möglicherweise nicht der beste Test).
Testen Sie dieselbe Abfrage lokal auf dem Postgres-Server. Wenn sie in einem angemessenen Zeitrahmen abgeschlossen wird, wissen Sie, dass es nicht an der Datenbank liegt. Wenn sie nicht abgeschlossen wird oder „zu lange“ dauert, liegt eine fehlerhafte Abfrage oder ein anderes Datenbankproblem vor, das behoben werden muss. Denken Sie unbedingt an die Speicher-E/A-Seite der Dinge. Möglicherweise überlasten Sie die Kapazität Ihrer Festplatten. Überprüfen Sie die VMware-Leistungsdiagramme, um dies zu bestätigen/ablehnen.
Wenn das funktioniert, deaktivieren Sie die Firewall und führen Sie dieselbe Abfrage auf dem Postgres-Server von „box1“ aus aus. Wenn das funktioniert, ist die VM->VM-Konnektivität wahrscheinlich einwandfrei.
Wenn das funktioniert, schalten Sie die Firewall wieder ein und testen Sie sie erneut. Wenn das funktioniert, liegt Ihr Problem wahrscheinlich außerhalb dieses Hosts, sodass Sie den Switch oder den externen Host debuggen müssen.

Viel Glück.

Answer

Einige Dinge, die Sie ausprobieren können:

Überprüfen Sie zunächst, ob Ihr Netzwerk ordnungsgemäß funktioniert. Angenommen, Sie haben verwaltete Switches, überprüfen Sie die Schnittstellenstatistiken auf Geschwindigkeits-/Duplex-Fehlanpassungen oder eine nicht übereinstimmende MTU. Überprüfen bzw. ersetzen Sie die Verkabelung, wenn Fehler auftreten (z. B.: Der Versuch, GigE über Cat5 statt Cat5e auszuführen, wird wahrscheinlich Probleme verursachen).
Führen Sie einige Tests durch, um zu beweisen, dass Sie zwischen den beiden Maschinen und zur externen Maschine Übertragungen mit Kabelgeschwindigkeit durchführen können. Netcat-, FTP- oder HTTP-Übertragungen sind hier ein guter Anfang (SCP wird möglicherweise CPU-gebunden und ist daher möglicherweise nicht der beste Test).
Testen Sie dieselbe Abfrage lokal auf dem Postgres-Server. Wenn sie in einem angemessenen Zeitrahmen abgeschlossen wird, wissen Sie, dass es nicht an der Datenbank liegt. Wenn sie nicht abgeschlossen wird oder „zu lange“ dauert, liegt eine fehlerhafte Abfrage oder ein anderes Datenbankproblem vor, das behoben werden muss. Denken Sie unbedingt an die Speicher-E/A-Seite der Dinge. Möglicherweise überlasten Sie die Kapazität Ihrer Festplatten. Überprüfen Sie die VMware-Leistungsdiagramme, um dies zu bestätigen/ablehnen.
Wenn das funktioniert, deaktivieren Sie die Firewall und führen Sie dieselbe Abfrage auf dem Postgres-Server von „box1“ aus aus. Wenn das funktioniert, ist die VM->VM-Konnektivität wahrscheinlich einwandfrei.
Wenn das funktioniert, schalten Sie die Firewall wieder ein und testen Sie sie erneut. Wenn das funktioniert, liegt Ihr Problem wahrscheinlich außerhalb dieses Hosts, sodass Sie den Switch oder den externen Host debuggen müssen.

Viel Glück.

Question 2

Sie haben ein MTU-Problem, aber ich bin mir nicht sicher, warum. Ich versuche, Ihre virtuelle Topologie hier zu verstehen.

Ihr Windows Vista-Notebook ist also mit dem „lokalen“ Netzwerk oder dem Internet verbunden?

Ich gehe davon aus, dass Ihr Windows Vista-Notebook mit dem Internet verbunden ist und dass Sie auf die externe IP-Adresse von „Box 1“ zugreifen, um die Portweiterleitung auf Port 5432 zu „Box 2“ zu nutzen. Wenn das der Fall ist, was erhalten Sie zurück, wenn Sie Folgendes versuchen:

ping -l 1472 -f <IP-Adresse von Box 1>

Edit: Okay – sehr gut. Wenn Sie möchten, führen Sie ein „ifconfig“ sowohl auf „Box 1“ als auch auf „Box 2“ aus und prüfen Sie den MTU-Wert auf jeder Ethernet-Schnittstelle. Sie sollten alle 1500 sein. (Ich versuche nur herauszufinden, warum „Box 1“ „Box 2“ mitgeteilt hat, dass sie ein 556 Byte großes Datagramm für Ihr Notebook nicht fragmentieren kann …)

Edit: Zow. Okay – das ist wild.

Wenn es nicht zu viel verlangt ist, könnten Sie den Inhalt (oder Links dazu) Ihrer iptables-Konfigurationen in die Frage posten? (Ich bin hier langsam ratlos. Was Sie beschreiben, habe ich häufig gemacht, bin mir aber nicht sicher, wie es funktioniert.)

Edit: Jetzt bin ich wieder bei dir. Okay. Ich bin jetzt etwas ratlos. Die iptables-Konfiguration scheint keine Probleme zu verursachen. Ich sehe, dass du UDP 5432 an „Box 2“ weiterleitest. Das musst du nicht weiterleiten – Postgres verwendet nur TCP. Das schadet aber nicht.

Haben Sie während Ihrer 20-minütigen Wartezeit einen Datenverkehr zwischen dem Vista-Notebook und „Box 2“ bemerkt? Können Sie diesen Zustand bei jeder Verbindung reproduzieren?

Es macht zwar keinen großen Unterschied, aber in der FORWARD-Kette auf „Box 1“ würde ich normalerweise die Regel festlegen, dass Pakete mit RELATED,ESTABLISHED ACCEPTS als erste Regel in der Kette gelten (um die Verarbeitung abzukürzen). Ich kann mir jedoch nicht vorstellen, dass dies für Sie erhebliche Auswirkungen auf die Leistung hätte.

Ich hasse es, die Antwort auf ein Problem nicht zu wissen. Das wird mich nachts wach halten.

Answer