Устранение неполадок, связанных с потерей сетевого подключения в Windows 2003 — что еще проверить?

Устранение неполадок, связанных с потерей сетевого подключения в Windows 2003 — что еще проверить?

Мы столкнулись со странной проблемой в нашем центре обработки данных. Наш резервный сервер (работающий с EMC Networker) теряет сетевое соединение каждый второй день около 3:00 утра (график резервного копирования начинается в полночь). После 2 часов простоя сетевое соединение автоматически восстанавливается и возвращается к нормальному состоянию.

Что мы наблюдали:

Маловероятно, что это проблема сети, так как он напрямую подключен к коммутатору фермы серверов (подключение уровня 2 без промежуточных переходов). Кроме того, сервер подключен к двум разным коммутаторам для балансировки нагрузки с помощью Broadcomm Teaming.

а) Если бы проблема была связана с коммутатором, то маловероятно, что оба сетевых порта выйдут из строя, поскольку они подключены к разным коммутаторам.

б) Возможная проблема с Vlan также исключена, поскольку другие устройства в том же Vlan работают нормально.

c) Интерфейс коммутатора всегда в рабочем состоянии. Но в период простоя наблюдается много потерь пакетов — это может быть связано с высокой загрузкой интерфейса резервного сервера (около 100%)

г) Связь восстанавливается без каких-либо изменений в сети.

Следующий подозреваемый — использование ресурсов на сервере Windows. И ЦП, и память редко превышают 80%, но использование сетевой карты тревожно высоко (почти 100%)

Не совсем уверен, как это расследовать?

решение1

Я подозреваю проблемы с драйверами или несоответствие дуплекса. Попробуйте обновить драйверы и проверьте дуплекс на обоих концах, чтобы он был одинаковым. Проверьте также статистику Ethernet с коммутатора (есть ли у вас ошибки, коллизии и т. д.).

Что значиттеряет сетевое подключение? Он недоступен, но интерфейс работает? Он доступен, но имеет много потерь пакетов?

решение2

Вы пробовали поменять сетевую карту?

решение3

Как вы определили, что он теряет сетевое подключение? Что именно вы имеете в виду? У вас есть что-то, что контролирует его и сообщает, что он недоступен? Есть ли что-нибудь в журналах событий, если да, то что?

Если загрузка сети высокая, то есть до точки, когда она полностью заполнена, вы можете увидеть то, что кажется разорванным соединением. Однако, по вашему описанию трудно сказать. Я предполагаю, что ваша задача резервного копирования загружает ваш канал. У вас есть задача резервного копирования, которая запускается через день :)

решение4

Что это за переключатель?

Возникают ли какие-либо проблемы со связью у других устройств на том же коммутаторе, когда возникает эта конкретная проблема? Хотя это редко и маловероятно, вы можете исчерпать ограниченные ресурсы на этом коммутаторе и в некотором смысле DOSить себя.

Кроме того, если у вас есть механизмы, предотвращающие DOS-атаки, они могут фактически заблокировать ваш проблемный сервер до тех пор, пока шаблоны использования не вернутся в норму.

Связанный контент