Wirhatte vor kurzem ein kleines Problemmit Netzwerken, bei denen mehrere Server zeitweise die Netzwerkverbindung verloren, was ziemlich schwierig zu beheben war (erforderte einen Hard-Reboot). Dies passiert seit etwa zwei Wochen scheinbar zufällig auf verschiedenen Servern. Wir konnten kein bestimmtes Muster erkennen.
Nach einigem Hin und Her stellten wir fest, dass der Switch für den Problemport 100 Mbit/s meldete:
Das klingt bemerkenswert nach dem, was in dem Artikel von Joel Spolsky passiert istFünf Warums
Michael verbrachte einige Zeit mit einer Nachuntersuchung und stellte fest, dass das Problem ein einfaches Konfigurationsproblem am Switch war. Es gibt mehrere mögliche Geschwindigkeiten, die ein Switch zur Kommunikation verwenden kann (10, 100 oder 1000 Megabit/Sekunde). Sie können die Geschwindigkeit entweder manuell einstellen oder den Switch automatisch die höchste Geschwindigkeit aushandeln lassen, mit der beide Seiten arbeiten können.Der ausgefallene Switch war auf Autonegotiation eingestellt. Normalerweise funktioniert das, aber nicht immer, und am Morgen des 10. Januar war es nicht so.
Wir haben jetztAuto-Negotiate deaktiviertauf unserer Netzwerkhardware und stellen Sie sie auf eine feste Rate von 1000 Mbit/s (Gigabit) ein.
Meine Fragen an diejenigen mit mehr Fachwissen zu Server-Hardware-Netzwerken:
- Wie häufig treten Auto-Negotiate-Probleme bei moderner Netzwerkhardware auf?
- Gilt es als gute, gängige Netzwerkpraxis, beim Einrichten des Netzwerks die automatische Aushandlung zu deaktivieren und feste Geschwindigkeiten festzulegen?
Antwort1
Mir ist bisher noch kein Problem mit der automatischen Aushandlung von Netzwerkgeschwindigkeiten aufgefallen, das nicht entweder durch (a) eine Nichtübereinstimmung zwischen manueller Einstellung an einem Ende der Verbindung und automatischer Einstellung am anderen Ende oder (b) eine fehlerhafte Komponente der Verbindung (Kabel, Anschluss usw.) verursacht wurde.
Dies hängt vom Administrator ab, aber meiner Erfahrung nach treten bei manueller Festlegung der Verbindungsgeschwindigkeiten und Duplexeinstellungen zwangsläufig Geschwindigkeitsfehler auf. Warum? Weil es nahezu unmöglich ist, die verschiedenen Verbindungen zwischen Switches und Servern zu dokumentieren und sich bei Änderungen dann an diese Dokumentation zu halten. Die meisten Fehler, die ich gesehen habe, sind auf 1(a) zurückzuführen und Sie geraten nur dann in diese Situation, wenn Sie anfangen, Geschwindigkeits-/Duplexeinstellungen manuell festzulegen.
Wie in derCisco-Dokumentation:
Wenn Sie die automatische Aushandlung deaktivieren, werden Verbindungsabbrüche und andere Probleme auf der physischen Ebene ausgeblendet. Deaktivieren Sie die automatische Aushandlung nur für Endgeräte, z. B. ältere Gigabit-NICs, die keine automatische Aushandlung von Gigabit unterstützen. Deaktivieren Sie die automatische Aushandlung zwischen Switches nur, wenn dies unbedingt erforderlich ist, da Probleme auf der physischen Ebene unentdeckt bleiben und zu Spanning Tree-Schleifen führen können.
Sofern Sie nicht bereit sind, ein Änderungsverwaltungssystem für Netzwerkänderungen einzurichten, das eine Überprüfung von Geschwindigkeit/Duplex erfordert (und vergessen Sie nicht die Flusskontrolle), oder bereit sind, mit gelegentlichen Nichtübereinstimmungen klarzukommen, die durch die manuelle Angabe dieser Einstellungen auf allen Netzwerkgeräten entstehen, bleiben Sie bei der Standardkonfiguration „Auto/Auto“.
Überwachen Sie künftig die Fehler an den Switch-Ports mitMRTGSo können Sie diese Probleme erkennen, bevor sie auftreten.
Bearbeiten:Ich sehe viele Leute, die auf Verhandlungsfehler bei alten Geräten verweisen. Ja, das war vor langer Zeit ein Problem, als die Standards erstellt wurden und nicht alle Geräte ihnen folgten. Sind Ihre Netzwerkkarten und Switches weniger als 10 Jahre alt? Wenn ja, dann ist das kein Problem.
Antwort2
Sehr häufig, ich hatte im Laufe der Jahre zahlreiche Probleme mit verschiedenen Arten von Hardware.
Meiner Meinung nach ist es eine gute Idee, die Geschwindigkeiten und Duplexe manuell einzurichten, wenn das Setup statisch ist (z. B. ein Server-Rack) und Sie nicht davon ausgehen, dass es Änderungen geben wird. Solange es gut dokumentiert ist, können zukünftige Probleme vermieden werden.
BEARBEITEN:
Nur um das klarzustellen: Ich befürworte nicht die Verwendung manueller Geschwindigkeiten in Ihrem gesamten Netzwerk. Ich würde sagen, dass Auto/Auto in 95 % der Fälle der richtige Weg ist. Ich sage nur, dass ich Probleme mit Duplex/Geschwindigkeit hatte und dass es kleine Teile meines Netzwerks (z. B. eines unserer Server-Racks) gibt, die überwiegend manuelle Einstellungen haben. Wir betreiben ein sehr streng kontrolliertes LAN, in dem ungenutzte Ports abgeschaltet werden und die meisten Ports mit MAC-Filtern ausgestattet sind, sodass es nicht sehr schwierig ist, die Geschwindigkeiten im Auge zu behalten.
Antwort3
Ich glaube, wenn die automatische Aushandlung eine Stunde am Tag oder einen Monat lang funktioniert hat und dann aus irgendeinem Grund „etwas passiert“, das durch die Einstellung der Verbindung auf eine feste Geschwindigkeit „behoben“ wird, gibt es ein Problem, das nicht gelöst, sondern umgangen wird. Ich denke, ich betrachte die Einstellung der Verbindung auf eine feste Geschwindigkeit als vorübergehende Lösung, bis das eigentliche Problem behoben ist.
Antwort4
Das Netzwerk, für das ich (zusammen mit ein paar anderen Leuten) verantwortlich bin, besteht aus ca. 40 Servern, über 1.000 Arbeitsstationen (verteilt über einen ziemlich großen Campus) und ca. 1.000 WAPs, die ebenfalls über ein großes Gebiet verteilt sind und über Netzwerkgeräte unterschiedlicher Art und Alters verfügen.
Wie dimitri.p sagte, wenn die automatische Aushandlung plötzlich nicht mehr gestoppt werden kann, ist das normalerweise ein Hinweis auf ein anderes Problem. Den Port manuell einzustellen ist so, als würde man jemandem, der in den Bauch gestochen wurde, ein Pflaster aufkleben – es stoppt vielleicht die Blutung, aber darunter ist mit Sicherheit eine Verletzung.
Meine übliche Checkliste:
- Hat sich an der Maschine etwas geändert? Treiber? Einstellungen auf Betriebssystem- oder BIOS-Ebene? Vielleicht wurde Autoneg im Betriebssystem deaktiviert?
- hast du die Patchkabel vertauscht undverifiziertdie Kabelverläufe (wenn es sich um einen längeren Verlauf als ein Rack handelt?)
- Haben Sie getestet, ob der Switch-Port defekt ist oder ausfällt?
- könnte die Netzwerkkarte defekt sein?
Wir, in der Regel,niemalsDeaktivieren Sie Autoneg auf Servern (oder irgendetwas anderem im Rechenzentrum), es sei denn, es handelt sich um eine Situation, in der alle anderen möglichen Ursachen ausgeschlossen wurden, wir Switch-Ports verschoben, Kabel gewechselt, die Netzwerkkarte getestet usw. haben und es keine andere Wahl gibt. In diesem Fall wird es bis zum Umfallen dokumentiert. Dies kommt sehr selten vor und normalerweise bei Geräten, auf die wir keinen Zugriff haben, um die BIOS- und Betriebssystemeinstellungen zu überprüfen.
Bei den Workstations und APs sieht die Sache allerdings anders aus. Fehlgeschlagenes Autoneg ist ein klassisches Zeichen für eine schlechte Kabelführung, und oft müssen wir Geschwindigkeit und Duplex manuell einstellen, bis die Sommersaison kommt, in der neue Kabel in den Wänden verlegt werden.