Виртуальная машина Hyper-V не отвечает по сети

Виртуальная машина Hyper-V не отвечает по сети

Недавно одна из наших виртуальных машин Hyper-V периодически переставала отвечать по сети. Кажется, это происходит каждые несколько дней, а иногда и по несколько раз в день. Я ни в коем случае не системный администратор, поэтому любые указания, которые вы могли бы дать, были бы очень кстати. Я включил все, что знаю, чтобы включить ниже. Если вам нужна дополнительная информация, я буду рад ее включить.

  • Я могу подключиться через консоль Hyper-V.
  • Я не могу подключиться к сетевым ресурсам, веб-приложениям IIS ни с помощью RDP, ни с помощью ping.
  • Использование памяти, похоже, нормальное (3 из 4 ГБ)
  • Загрузка процессора кажется низкой.
  • Мы не знаем точное время сбоя сервера, но следующая ошибка постоянно появляется примерно в это время:

    Ошибка 5719, NETLOGON
    Этот компьютер не смог настроить безопасный сеанс с контроллером домена в домене ***по следующим причинам: В настоящее время нет доступных серверов входа для обслуживания запроса на вход. Это может привести к проблемам с аутентификацией. Убедитесь, что этот компьютер подключен к сети. Если эта проблема сохраняется, обратитесь к администратору домена.

РЕДАКТИРОВАТЬ

Вот несколько деталей, которые я упустил из виду при написании первого поста.

  • И сервер Hyper-V, и виртуальная машина работают под управлением Windows Server 2008 Standard.
  • На сервере Hyper-V имеется 6 виртуальных машин, все они совместно используют одну внешнюю виртуальную сеть, работающую на гигабитном адаптере.
  • Проблема, похоже, касается только этой виртуальной машины.
  • По крайней мере одна из других виртуальных машин на сервере имеет довольно высокую нагрузку.

решение1

Похоже, что проблема с виртуальным NIC и/или взаимодействием части программного обеспечения с виртуальным NIC. Вот несколько вещей, которые вы можете попробовать, но я бы поставил на антивирус/брандмауэр.

  1. Все ли ваши виртуальные машины имеют один и тот же антивирусный продукт? Убедитесь, что ваш антивирус/брандмауэр поддерживает Server 2008 с Hyper-V, если нет, попробуйте другой (или временно удалите, если это возможно) ваш антивирус/брандмауэр в качестве теста, чтобы посмотреть, исчезнет ли проблема. Это было причиной наших систем, каждые 24-48 часов, казалось бы, случайная виртуальная машина теряла подключение, пока ее не перезагрузили.

  2. Убедитесь, что ваш антивирусный продукт в управляющей/родительской ОС имеет соответствующие исключения папок и процессов (идентификатор статьи MS: 961804)

  3. Попробуйте отключить функции разгрузки сетевой карты, такие как Large Send Offload и CheckSum Offload в сетевом адаптере виртуальной машины, они включены по умолчанию в Windows, но возможно, что ваша аппаратная сетевая карта не поддерживает их (или плохо взаимодействует с Hyper-V), что может вызвать проблемы с производительностью и сетевые ошибки. Есть несколько способов сделать это, но самый быстрый для целей тестирования — (в виртуальной машине) открыть свойства адаптера сетевой карты, перейти на вкладку «Дополнительно» и отключить функции разгрузки в списке, а затем перезагрузить виртуальную машину. (Идентификатор статьи MS: 951037) Это, похоже, довольно распространенная проблема. Вероятно, вы также увидите ошибки на сетевых коммутаторах на связанных портах, если это проблема.

решение2

Следующая статья может быть связана с этой проблемой, а может и нет... Предположительно, она была исправлена ​​в 2008 R2, затем сломана в SP1, а затем снова исправлена ​​после SP1 в этом исправлении.

http://support.microsoft.com/kb/2263829

По моему опыту, эта проблема все еще существует даже после применения исправления.

На сегодняшний день я не могу найти способ решить эту проблему. Я думаю, что потратил больше недели своего времени, отключая TCP-разгрузку и множество подобных настроек; ничто не спасает сетевой стек Hyper-V от сбоя. Я не уверен, что это связано исключительно с сетевой нагрузкой, поскольку я могу сделать так, чтобы это не сработало при использовании ARCserve для резервного копирования моей виртуальной машины Exchange 2010. Но это происходит только на полпути во время резервного копирования диска C:. Если я удалю «Клиентский агент для Windows» и оставлю агент Exchange только на виртуальной машине, то я смогу делать резервные копии базы данных Exchange снова и снова, без проблем. А скорость передачи данных по (виртуальной) сети при резервном копировании базы данных Exchange намного выше, чем при резервном копировании диска C: с тысячами маленьких файлов.

Итак, это заставляет меня думать, что это, возможно, какая-то проблема с вводом-выводом файлов на VHD? Возможно, проблема SMB (использует ли ARCserve Backup SMB?)? Сочетание как высокого ввода-вывода файлов, так и сетевой нагрузки? Может быть, ошибка в службах интеграции Hyper-V? Что-то не так, и я не могу поверить, что об этом больше нет шума. У меня есть 2 сервера, в разных местах, и оба испытывают эту проблему, хотя симптомы и восстановление немного различаются.

Другой сервер теряет сетевой стек в VM, но вам нужно перезагрузить хост для восстановления, так как VM выходит из строя и перестает отвечать во время перезагрузки. Таким образом, это более серьезно, поскольку весь хост нуждается в перезагрузке, чтобы исправить сбой сети на одной VM. Это симптом, о котором сообщил jwerwie в исходном сообщении.

Возня с MAC-адресами, настройками TCP Offload и т. д. может показаться колоссальной тратой времени.

решение3

И вот внезапно одна из моих виртуальных машин перестала отвечать. Любые другие виртуальные машины, работающие на том же хосте Hyper-V, могли пинговать сервер, но любой, кто находился за пределами VMHost, получал очень прерывистый ответ.

Оказывается, мой коллега запустил старый сервер, который мы некоторое время назад P2Ved. У виртуальной машины все еще был тот же MAC-адрес, что и у физического сервера. В моем случае это оказалось проблемой MAC-адреса.

Сказав это, когда я создавал свою среду Hyper-V, я отключил все функции разгрузки на сетевых картах Broadcom сервера, которые использовались Hyper-V. У меня не было ни одной сетевой проблемы до этой.

решение4

  1. Есть ли вероятность конфликта IP-адресов? Если у сервера статический адрес, пересекается ли он с какими-либо пулами DHCP? Помните, что ваш пул DHCP Windows может быть не единственным в вашей среде, особенно если у вас есть такие устройства, как устройства VPN или контроллеры WLAN.

  2. Есть ли другие виртуальные машины, использующие тот же физический сетевой интерфейс? У всех ли есть сетевое подключение, а у этой нет?

Связанный контент