Postgresql за брандмауэром: запрос выполняется слишком долго

Question 1

Вот что стоит попробовать:

Начните с проверки того, что ваша сеть ведет себя нормально. Предполагая, что у вас есть управляемые коммутаторы, посмотрите статистику интерфейса на предмет несоответствия скорости/дуплекса или несоответствия MTU. Рассмотрите возможность проверки/замены кабелей, если что-то работает с ошибками (например, попытка запустить GigE по Cat5 вместо Cat5e, скорее всего, приведет к неприятностям).
Проведите несколько тестов, чтобы убедиться, что вы можете осуществлять передачу данных со скоростью кабеля между двумя машинами и на внешнюю машину; для начала подойдут передачи данных через netcat, ftp или http (scp может ограничивать производительность ЦП, поэтому этот тест может оказаться не лучшим).
Проверьте тот же запрос локально на сервере Postgres. Если он завершается в соответствующие сроки, вы знаете, что это не база данных. Если он не завершается или выполняется «слишком долго», то у вас плохой запрос или другая проблема с базой данных, которую нужно отладить. Обязательно рассмотрите сторону ввода-вывода хранилища; вы можете перегружать то, что способны предоставить ваши диски. Проверьте графики производительности VMware, чтобы подтвердить или опровергнуть.
Если это работает, отключите брандмауэр и выполните тот же запрос на сервере postgres из "box1". Если это работает, то соединение VM->VM, скорее всего, в порядке.
Если это сработает, верните брандмауэр в рабочее состояние и проверьте снова. Если это сработает, то ваша проблема, скорее всего, внешняя по отношению к этому хосту, оставляя коммутатор или внешний хост для отладки.

Удачи.

Answer

Вот что стоит попробовать:

Начните с проверки того, что ваша сеть ведет себя нормально. Предполагая, что у вас есть управляемые коммутаторы, посмотрите статистику интерфейса на предмет несоответствия скорости/дуплекса или несоответствия MTU. Рассмотрите возможность проверки/замены кабелей, если что-то работает с ошибками (например, попытка запустить GigE по Cat5 вместо Cat5e, скорее всего, приведет к неприятностям).
Проведите несколько тестов, чтобы убедиться, что вы можете осуществлять передачу данных со скоростью кабеля между двумя машинами и на внешнюю машину; для начала подойдут передачи данных через netcat, ftp или http (scp может ограничивать производительность ЦП, поэтому этот тест может оказаться не лучшим).
Проверьте тот же запрос локально на сервере Postgres. Если он завершается в соответствующие сроки, вы знаете, что это не база данных. Если он не завершается или выполняется «слишком долго», то у вас плохой запрос или другая проблема с базой данных, которую нужно отладить. Обязательно рассмотрите сторону ввода-вывода хранилища; вы можете перегружать то, что способны предоставить ваши диски. Проверьте графики производительности VMware, чтобы подтвердить или опровергнуть.
Если это работает, отключите брандмауэр и выполните тот же запрос на сервере postgres из "box1". Если это работает, то соединение VM->VM, скорее всего, в порядке.
Если это сработает, верните брандмауэр в рабочее состояние и проверьте снова. Если это сработает, то ваша проблема, скорее всего, внешняя по отношению к этому хосту, оставляя коммутатор или внешний хост для отладки.

Удачи.

Question 2

У вас проблема с MTU, но я не уверен, почему. Я пытаюсь разобраться в вашей виртуальной топологии.

Итак, ваш ноутбук с Windows Vista подключен к «локальной» сети или к сети Интернет?

Я предполагаю, что ваш ноутбук с Windows Vista подключен к Интернету и что вы обращаетесь к внешнему IP-адресу "box 1", чтобы использовать переадресацию порта 5432 для доступа к "box 2". Если это так, что вы получаете в ответ, когда пытаетесь:

ping -l 1472 -f <IP-адрес ящика 1>

Редактировать: Хорошо -- очень хорошо. Если вы это сделаете, запустите "ifconfig" на "box 1" и "box 2" и проверьте значение MTU на каждом интерфейсе Ethernet. Они все должны быть 1500. (Я просто пытаюсь понять, почему "box 1" сообщил "box 2", что он не может фрагментировать 556-байтовую датаграмму, связанную с вашим ноутбуком...)

Редактировать: Ого. Ладно, это дико.

Если это не слишком большая просьба, не могли бы вы разместить содержимое (или ссылки на него) ваших конфигураций iptables в вопросе? (Я начинаю приходить в замешательство. То, что вы описываете, я часто делаю, но не уверен, как это работает.)

Редактировать: Снова с вами. Хорошо. Теперь я начинаю путаться. Конфигурация iptables не выглядит так, как будто она должна вызывать какие-либо проблемы. Я вижу, что вы перенаправляете UDP 5432 на "box 2". Вам не нужно это перенаправлять — Postgres использует только TCP. Хотя это ничему не повредит.

За 20 минут ожидания вы видели движение трафика между ноутбуком Vista и "box 2"? Можете ли вы воспроизвести это состояние каждый раз при подключении?

Не то чтобы это имело большое значение, но в цепочке FORWARD на "box 1" я бы обычно делал правило, которое ПРИНИМАЕТ пакеты с RELATED,ESTABLISHED, установленным первым правилом в цепочке (для укорачивания обработки). Я не думаю, что это окажет какое-либо существенное влияние на производительность для вас, хотя.

Ненавижу не знать ответа на вопрос. Это не даст мне спать по ночам.

Answer