
Wir haben in unserem Rechenzentrum ein seltsames Problem. Unser Backup-Server (auf dem EMC Networker läuft) verliert jeden zweiten Tag gegen 3:00 Uhr die Netzwerkverbindung (der Backup-Zeitplan beginnt um Mitternacht). Nach 2 Stunden Ausfallzeit wird die Netzwerkverbindung automatisch wiederhergestellt und ist wieder normal.
Unsere Beobachtungen:
Es handelt sich wahrscheinlich nicht um ein Netzwerkproblem, da der Server direkt mit dem Serverfarm-Switch verbunden ist (Layer-2-Verbindung ohne Zwischenhops). Darüber hinaus ist der Server für den Lastenausgleich mit Broadcomm Teaming an zwei verschiedene Switches angeschlossen.
a) Wenn es sich um ein Switch-bezogenes Problem handelt, ist es unwahrscheinlich, dass beide Netzwerkports ausfallen, da sie mit unterschiedlichen Switches verbunden sind.
b) Ein mögliches VLAN-weites Problem kann ebenfalls ausgeschlossen werden, da mit anderen Geräten im selben VLAN alles in Ordnung ist.
c) Der Switch-Schnittstellenstatus ist immer aktiv. Während der Ausfallzeit kommt es jedoch zu vielen Paketverlusten – Dies kann auf die hohe Schnittstellenauslastung des Backup-Servers (nahezu 100 %) zurückgeführt werden.
d) Die Konnektivität wird ohne Änderungen im Netzwerk wiederhergestellt.
Der nächste Verdächtige ist die Ressourcenauslastung auf dem Windows-Server. Sowohl CPU als auch Speicher haben selten 80 % überschritten, aber die Auslastung der NIC-Karte ist alarmierend hoch (nahe 100 %)
Sie wissen nicht genau, wie Sie das untersuchen sollen?
Antwort1
Ich vermute Treiberprobleme oder eine Duplex-Fehlanpassung. Versuchen Sie, die Treiber zu aktualisieren und überprüfen Sie, ob der Duplex an beiden Enden gleich ist. Überprüfen Sie auch die Ethernet-Statistiken des Switches (ob Fehler, Kollisionen usw. vorliegen).
Was bedeutetverliert die Netzwerkverbindung? Es ist nicht erreichbar, aber die Schnittstelle ist aktiv? Es ist erreichbar, aber es kommt zu vielen Paketverlusten?
Antwort2
Haben Sie versucht, die Netzwerkkarte zu wechseln?
Antwort3
Wie kommen Sie zu dem Schluss, dass die Netzwerkverbindung verloren geht? Was genau meinen Sie damit? Gibt es etwas, das das Gerät überwacht und Ihnen mitteilt, dass es nicht erreichbar ist? Steht etwas in den Ereignisprotokollen, und wenn ja, was?
Wenn die Netzwerkauslastung hoch ist, also bis zur völligen Sättigung, sehen Sie möglicherweise, dass die Verbindung unterbrochen ist. Das ist anhand Ihrer Beschreibung jedoch schwer zu sagen. Ich vermute jedoch, dass Ihr Backup-Job Ihre Leitung überlastet. Haben Sie einen Backup-Job, der jeden zweiten Tag ausgeführt wird? :)
Antwort4
Um was für einen Schalter handelt es sich?
Haben andere Geräte am selben Switch Kommunikationsprobleme, wenn dieses spezielle Problem auftritt? Obwohl dies selten und unwahrscheinlich ist, erschöpfen Sie möglicherweise die begrenzten Ressourcen dieses Switches und verursachen in gewisser Weise einen DOS-Fehler.
Wenn Sie außerdem über Mechanismen zum Verhindern von DOS-Angriffen verfügen, können diese Ihren problematischen Server im Prinzip in ein schwarzes Loch sperren, bis sich das Nutzungsverhalten wieder normalisiert hat.