El servidor de Windows pierde conectividad

El servidor de Windows pierde conectividad

Un Windows Server 2008 R2 (en realidad SBS 2011) con Service Pack 1 comenzó a exponer un problema de conectividad de red de repente que parece bastante difícil de depurar:

Ocasionalmente (siempre durante el horario comercial, aproximadamente 1 o 2 veces al día) se pierde la conectividad de la red. El host sigue ejecutándose, puedo usar la consola de forma interactiva. El enlace Ethernet, como lo indican los LED en la administración del conmutador y la NIC, sigue activo. La configuración de IP todavía está adjunta a la interfaz y parece válida ( ipconfigproduce una salida sensata). Sin embargo, ni siquiera las búsquedas de ARP pueden completarse exitosamente.

Una lista de cosas que no ayudaron:

  • restablecer el puerto del conmutador o el conmutador
  • deshabilitar / volver a habilitar la interfaz del servidor (ya sea en ncpa.cpl o en el administrador de dispositivos)
  • desconectar / volver a conectar el cable de red

Apagar y reiniciar el servidor siempre ayuda: se puede utilizar como siempre después del inicio.

Cosas comprobadas:

  • los registros de eventos no enumeran ningún evento sospechoso
  • Los contadores de puertos de red del switch no muestran errores.
  • la conexión de red no muestra ningún signo de queerness (pérdidas, latencias, mal rendimiento) mientras los datos fluyan
  • el cable y la NIC han sido reemplazados para descartar una falla obvia de hardware
  • La administración de energía para la NIC se ha deshabilitado en las propiedades del dispositivo (administrador de dispositivos).
  • la NIC utilizada es una Intel PRO/1000 CT con el procesador de red Intel 82574L (el mismo tipo se utiliza en los puertos NIC integrados)
  • la suite antivirus de AVG (Edición empresarial antivirus) está instalado en el servidor, pero el componente Firewall se eliminó al instalarlo, por lo que no debería interferir aquí

Como parece poco probable que se produzca una falla de hardware, estoy tratando de determinar qué componente de software podría ser responsable de estropear tanto la pila de red. ¿Existe alguna forma sensata de averiguar qué controladores están en la pila de red y, por lo tanto, posiblemente interfieren? ¿Alguien ha visto algo similar antes? Cualquier idea que pueda conducir a la resolución es bienvenida.

Respuesta1

Haría dos cosas para intentar solucionar el problema:

Primero, retire el AV. Completamente. No desactives simplemente una parte u otra, desinstálala. En segundo lugar, suponiendo que siga fallando de vez en cuando, cambie la NIC y los cables.

Respuesta2

Ha desaparecido tan repentinamente como llegó. Mientras tanto, el interruptor ha sido reemplazado, pero antes se ha demostrado que el sistema ha estado funcionando durante un par de días sin problemas.

Editar: aunque no tengo pruebas decentes de esto, parece que el software responsable ha sido elProxy WinGateinstalado en el mismo servidor. Los informes de los usuarios indican que se observaron problemas después de que el producto se actualizó y desaparecieron después de desinstalarlo. Se ha documentado un escenario similar que involucra controladores de filtro TDI.aquí, aunque la resolución sólo cubre Windows Server 2008. Y WinGate parece estar empleando TDI.

información relacionada