NosotrosRecientemente tuve un pequeño problemacon redes donde varios servidores perderían intermitentemente la conectividad de la red de una manera bastante dolorosa de resolver (requería un reinicio completo). Esto ha estado sucediendo durante aproximadamente dos semanas, aparentemente al azar, en diferentes servidores. No hay ningún patrón particular que podamos discernir.
Después de investigar un poco, vimos que el conmutador informaba 100 Mbps para el puerto problemático:
Esto se parece notablemente a lo que sucedió en el artículo de Joel Spolsky.Cinco porqués
Michael pasó algún tiempo haciendo una autopsia y descubrió que el problema era un simple problema de configuración en el conmutador. Hay varias velocidades posibles que un conmutador puede utilizar para comunicarse (10, 100 o 1000 megabits/segundo). Puede configurar la velocidad manualmente o puede dejar que el interruptor negocie automáticamente la velocidad más alta con la que ambos lados pueden trabajar.El interruptor que falló estaba configurado para negociación automática. Esto suele funcionar, pero no siempre, y en la mañana del 10 de enero no fue así.
tenemos ahoranegociación automática deshabilitadaen nuestro hardware de red y configúrelo a una velocidad fija de 1000 Mbps (gigabit).
Mis preguntas para aquellos con más experiencia en redes de hardware de servidores:
- ¿Qué tan comunes son los problemas de negociación automática con el hardware de red moderno?
- ¿Se considera una buena práctica de red estándar desactivar la negociación automática y establecer velocidades fijas al configurar la red?
Respuesta1
Todavía tengo que ver un problema con la negociación automática de velocidades de red que no sea causado por (a) una falta de coincidencia entre manual en un extremo del enlace y automático en el otro o (b) un componente defectuoso del enlace ( cable, puerto, etc.).
Esto depende del administrador, pero mi experiencia me ha demostrado que si especifica manualmente las velocidades de enlace y la configuración dúplex, seguramente encontrará discrepancias de velocidad. ¿Por qué? Porque es casi imposible documentar las distintas conexiones entre conmutadores y servidores y luego seguir esa documentación al realizar cambios. La mayoría de las fallas que he visto se deben a 1(a) y solo llegas a esa situación cuando comienzas a configurar manualmente la configuración de velocidad/dúplex.
Como se menciona en eldocumentación de cisco:
Si desactiva la negociación automática, se ocultarán las caídas de enlaces y otros problemas de la capa física. Desactive únicamente la negociación automática en dispositivos finales, como las NIC Gigabit más antiguas que no admiten la negociación automática Gigabit. No desactive la negociación automática entre conmutadores a menos que sea absolutamente necesario, ya que los problemas de la capa física pueden pasar desapercibidos y provocar bucles de árbol de expansión.
A menos que esté preparado para configurar un sistema de gestión de cambios para cambios de red que requiera la verificación de velocidad/dúplex (y no olvide el control de flujo) o esté dispuesto a lidiar con discrepancias ocasionales que surgen al especificar manualmente estas configuraciones en todos los dispositivos de red, luego quédese con la configuración predeterminada de auto/auto.
En el futuro, considere monitorear los errores en los puertos del switch conMRTGpara que pueda detectar estos problemas antes de que tenga un problema.
Editar:Veo a mucha gente haciendo referencia a fallos de negociación en equipos antiguos. Sí, esto fue un problema hace mucho tiempo cuando se creaban los estándares y no todos los dispositivos los seguían. ¿Sus NIC y conmutadores tienen menos de 10 años? Si es así, entonces esto no será un problema.
Respuesta2
Muy común, he tenido numerosos problemas a lo largo de los años con varios tipos de hardware.
En mi opinión, si la configuración es estática (es decir, un bastidor de servidor) y no cree que haya cambios, es una buena idea configurar las velocidades y los dúplex manualmente. Siempre que esté bien documentado para poder evitar problemas futuros.
EDITAR:
Solo para aclarar, no estoy recomendando el uso de velocidades manuales en toda la red; diría que el 95% de las veces, automático/automático es el camino a seguir. Solo digo que he tenido problemas con la velocidad/dúplex y que hay pequeñas partes de mi red (es decir, uno de nuestros bastidores de servidores) que tienen configuraciones en su mayoría manuales. Operamos una LAN muy controlada con puertos no utilizados cerrados y filtros MAC en la mayoría de los puertos, por lo que realizar un seguimiento de las velocidades no es muy difícil.
Respuesta3
Creo que si la negociación automática funcionó durante una hora al día o un mes y luego, por alguna razón, "algo sucede" y establecer el enlace en velocidad fija "lo soluciona", hay un problema que no se resuelve, sino que se evita. Supongo que veo configurar el enlace como solucionado como una solución temporal hasta que se corrija el problema real.
Respuesta4
La red de la que soy responsable (junto con algunos otros) está compuesta por ~40 servidores, más de 1000 estaciones de trabajo (repartidas en un campus bastante grande) y ~1000 WAP también distribuidos en un área grande con diferentes tipos y edades. de equipos de red.
Como dijo dimitri.p, cuando algo de repente no logra detener la negociación automática, generalmente es una indicación de otro problema. Configurar el puerto manualmente es similar a ponerle una tirita a alguien que fue apuñalado en el estómago: podría detener el sangrado, pero seguramente habrá daños debajo.
Mi lista de verificación habitual:
- ¿Cambió algo en la máquina? conductores? ¿Configuraciones a nivel de sistema operativo o BIOS? ¿Quizás autoneg estaba deshabilitado en el sistema operativo?
- ¿Has cambiado los cables de conexión yverificadoel cable corre (¿si es un tendido más largo que un bastidor?)
- ¿Ha probado para ver si el puerto del conmutador está defectuoso o falla?
- ¿Podría estar funcionando mal la NIC?
Nosotros, por regla general,nuncadeshabilite la negación automática en los servidores (o cualquier otra cosa en el centro de datos) a menos que sea una situación en la que se hayan eliminado todas las demás causas posibles, movimos los puertos del switch, cambiamos los cables, probamos la NIC, etc. y no hay otra opción. En cuyo caso, queda documentado hasta la muerte. Esto sucede muy raramente y generalmente con dispositivos a los que no podemos acceder para verificar la configuración del BIOS y el sistema operativo.
Las estaciones de trabajo y los AP, por otro lado, son una historia diferente. La autoneg fallida es una señal clásica de un mal tendido de cables, y muchas veces tenemos que configurar manualmente la velocidad y el dúplex hasta que llega la temporada de verano de cables nuevos en las paredes.