ファイアウォールの背後にある PostgreSQL: クエリに時間がかかりすぎる

Question 1

試してみるべきこと:

まず、ネットワークが正常に動作していることを確認します。管理対象スイッチがある場合は、インターフェイス統計で速度/デュプレックスの不一致または MTU の不一致を調べます。エラーが発生している場合は、ケーブルの確認/交換を検討してください (例: Cat5e ではなく Cat5 で GigE を実行しようとすると、問題が発生する可能性があります)。
2 台のマシン間および外部マシンとの間でワイヤースピード転送が可能であることを証明するために、いくつかのテストを実行します。netcat、ftp、または http 転送は、ここでは良いスタートになります (scp は CPU にバインドされる可能性があるため、最適なテストではない可能性があります)。
同じクエリを Postgres サーバー上でローカルにテストします。適切な時間枠で完了した場合、データベースに問題がないことがわかります。完了しないか、時間がかかりすぎる場合は、デバッグする必要があるクエリが間違っているか、データベースに他の問題があることになります。ストレージ I/O 側を必ず考慮してください。ディスクが提供できる容量が飽和状態になっている可能性があります。VMware のパフォーマンスグラフをチェックして、確認または否定してください。
それが機能すると仮定して、ファイアウォールを無効にし、「box1」から postgres サーバーに対して同じクエリを実行します。それが機能する場合、VM 間接続はおそらく正常です。
それが機能すると仮定して、ファイアウォールを再起動して再度テストします。それが機能する場合、問題はそのホストの外部にある可能性が高いため、スイッチまたは外部ホストをデバッグする必要があります。

幸運を。

Answer

試してみるべきこと:

まず、ネットワークが正常に動作していることを確認します。管理対象スイッチがある場合は、インターフェイス統計で速度/デュプレックスの不一致または MTU の不一致を調べます。エラーが発生している場合は、ケーブルの確認/交換を検討してください (例: Cat5e ではなく Cat5 で GigE を実行しようとすると、問題が発生する可能性があります)。
2 台のマシン間および外部マシンとの間でワイヤースピード転送が可能であることを証明するために、いくつかのテストを実行します。netcat、ftp、または http 転送は、ここでは良いスタートになります (scp は CPU にバインドされる可能性があるため、最適なテストではない可能性があります)。
同じクエリを Postgres サーバー上でローカルにテストします。適切な時間枠で完了した場合、データベースに問題がないことがわかります。完了しないか、時間がかかりすぎる場合は、デバッグする必要があるクエリが間違っているか、データベースに他の問題があることになります。ストレージ I/O 側を必ず考慮してください。ディスクが提供できる容量が飽和状態になっている可能性があります。VMware のパフォーマンスグラフをチェックして、確認または否定してください。
それが機能すると仮定して、ファイアウォールを無効にし、「box1」から postgres サーバーに対して同じクエリを実行します。それが機能する場合、VM 間接続はおそらく正常です。
それが機能すると仮定して、ファイアウォールを再起動して再度テストします。それが機能する場合、問題はそのホストの外部にある可能性が高いため、スイッチまたは外部ホストをデバッグする必要があります。

幸運を。

Question 2

MTU の問題が発生していますが、その理由はわかりません。ここでは仮想トポロジについて理解しようとしています。

それで、Windows Vista ノートブックは「ローカル」ネットワークに接続されていますか、それともインターネットネットワークに接続されていますか?

Windows Vista ノートブックがインターネットに接続されており、ポート 5432 のポート転送を使用して「ボックス 2」にアクセスするために「ボックス 1」の外部側 IP アドレスにアクセスしていると想定しています。その場合、次の操作を実行すると何が返されますか。

ping -l 1472 -f <ボックス1のIPアドレス>

編集: わかりました。非常に良いです。よろしければ、「box 1」と「box 2」の両方で「ifconfig」を実行し、各イーサネットインターフェイスの MTU 値を調べてください。すべて 1500 になっているはずです。(「box 1」が「box 2」に、ノートブック宛ての 556 バイトデータグラムをフラグメント化できないと伝えた理由を理解しようとしているだけです...)

編集: うわー。すごいですね。

お願いしすぎでなければ、iptables 構成の内容 (またはそのリンク) を質問に投稿していただけますか? (ここで行き詰まってきています。あなたが説明していることは私が頻繁に行っていることですが、どのように故障しているのかよくわかりません。)

編集: 戻ってきました。わかりました。これで困惑してしまいました。iptables の設定は、問題を引き起こすようなものではありません。UDP 5432 を「ボックス 2」に転送しているのがわかります。これを転送する必要はありません。Postgres は TCP のみを使用します。ただし、これによって何か問題が発生することはありません。

20 分間待機している間に、Vista ノートブックと「ボックス 2」の間でトラフィックが移動しているのを確認しましたか? 接続するたびにその状態を再現できますか?

大きな違いがあるわけではありませんが、「ボックス 1」の FORWARD チェーンでは、通常、RELATED、ESTABLISHED が設定されたパケットを ACCEPT するルールをチェーンの最初のルールにします (処理を短縮するため)。ただし、これがパフォーマンスに大きな影響を与えるとは思えません。

問題の答えが分からないのは嫌だ。これでは夜も眠れなくなる。

Answer