Cisco WS-C6509-E: Problem mit ARP-Cache-Beschädigung?

Cisco WS-C6509-E: Problem mit ARP-Cache-Beschädigung?

Wir haben ein Problem mit unserem Catalyst 6500-Switch und vermuten, dass der ARP-Cache beschädigt ist. Dies äußert sich in den folgenden Symptomen:

  1. Beim Versuch, ein System anzupingen, das zuvor noch nicht aufgelöst wurde, läuft die erste Ping-Antwort ab, und alle weiteren sind erfolgreich: Ping an foo.network.com [xxx.xx.xx.xx] mit 32 Byte Daten: Anforderung ist abgelaufen. Antwort von xxx.xx.xx.xx: Bytes=32 Zeit=5 ms TTL=55 Antwort von xxx.xx.xx.xx: Bytes=32 Zeit=3 ms TTL=55 Antwort von xxx.xx.xx.xx: Bytes=32 Zeit=3 ms TTL=55

  2. Wenn das Beschädigungsproblem auftritt, läuft jeder zweite Ping ab: Ping an foo.network.com [xxx.xx.xx.xx] mit 32 Byte Daten: Antwort von xxx.xx.xx.xx: Bytes=32 Zeit=5 ms TTL=55 Zeitüberschreitung der Anforderung. Antwort von xxx.xx.xx.xx: Bytes=32 Zeit=5 ms TTL=55 Zeitüberschreitung der Anforderung.

  3. Das Löschen des ARP-Cache behebt das Problem vorübergehend. Zum Löschen des ARP-Cache verwenden wir die Befehle: „clear arp cache clear ip cache“ (Arp-Cache löschen), „clear ip cache“ (IP-Cache löschen). Dadurch wird das Problem behoben, aber es wird mit Sicherheit erneut auftreten.

Details zum Schalter:

IOS (tm) s72033_rp Software (s72033_rp-PK9SV-M), Version 12.2(17d)SXB8, Release-Software (fc2)

Cisco WS-C6509-E (R7000) Prozessor (Revision 1.1)

Für jede Hilfe bin ich dankbar. Danke

ERKLÄRUNG: Wir haben das Netzwerk, das wir verwalten, und sind dann an das Unternehmensnetzwerk angeschlossen. Alle Anfragen an Maschinen innerhalb des von uns verwalteten Netzwerks funktionieren einwandfrei. Wir haben nur Probleme mit Maschinen im anderen Netzwerk.

Antwort1

Ich würde Ihnen empfehlen, einen Fall bei Cisco zu eröffnen.
Dort können Sie nach bekannten Fehlern in Ihrer iOS-Version suchen und werden Sie nach Konfigurationsdetails fragen, die Sie hier vielleicht nicht veröffentlichen möchten. (Aber wenn Sie möchten, können Sie das Ergebnis eines technischen Tests irgendwo posten, es könnte uns helfen.)
Wird es auch nach einem Neustart nicht angehängt oder wurde es nach einer langen Betriebszeit beschädigt?

Antwort2

  • Tritt dieses Problem bei PINGs von der CLI des Switches oder von einem mit dem Switch verbundenen PC auf?

  • Bietet dieser Switch Layer-3-Funktionen (Routing)?

  • Zeigen die von Ihnen angezeigten PINGs Probleme zwischen zwei Geräten im selben Subnetz oder über Subnetze hinweg?

  • Zeigt das Protokoll auf dem Switch (ich glaube, es heißt „show log hist“) irgendwelche Unstimmigkeiten an?

  • Betrifft das Problem nur die Paketübermittlung an einige Geräte oder sind Ihrer Ansicht nach mehrere Geräte davon betroffen?

Ich hatte vor ein paar Jahren bei einem Kunden ein ähnliches Problem. Ich habe die Ausgabe eines „Show Mac-“ vor dem Auftreten des Problems und dann während des Auftretens des Problems aufgezeichnet und verglichen, um nach Geräten zu suchen, die vor und nach dem Ausfall an unterschiedlichen Ports angeschlossen zu sein schienen.

Ich habe festgestellt, dass es im LAN ein eingebettetes Gerät gab (in diesem Fall eine Uhr), das regelmäßig eine Reihe von Frames mit einer „gefälschten“ Quelladresse übertrug, was die Bridging-Tabelle des Switches verwirrte und dazu führte, dass der Switch eine Zeit lang Frames über den falschen Port sendete. Ich konnte dies in der „show mac-“-Ausgabe sehen, indem ich bemerkte, dass Geräte, die eigentlich nicht ihre Ports hätten wechseln sollen, dies anscheinend taten.

Klingt, als würde die Fehlersuche Spaß machen! Ich wünschte, ich wäre dabei ... >smile<

Bearbeiten:

Danke für die Kommentare.

„show log hist“ zeigt ein permanentes Protokoll. Solange Sie das Protokoll nicht löschen, bleiben alle dort gemeldeten Nachrichten auch nach dem Löschen des ARP-Cache auf dem Switch erhalten.

Gibt es zwischen Ihrem 6509 und dem Unternehmensrechenzentrum, in dem sich die Problemgeräte befinden, einen anderen Router?

Verwenden Sie dynamische Routing-Protokolle?

Mein Bauchgefühl sagt mir Folgendes:

Ich empfehle Ihnen dringend, vor dem Auftreten eines Fehlers und erneut während des Auftretens eines Fehlers eine Kopie von „show mac-“ und „show arp“ zu speichern (das Erfassen mit einem Programm wie PuTTY sollte nur einen Moment dauern, sodass Sie schnell mit dem Leeren des ARP-Cache fortfahren können).

Mir ist klar, dass Sie diese Aufnahmen hier nicht einfach veröffentlichen können, aber ich würde Ihnen empfehlen, sie in eine Tabelle oder Datenbank einzutragen und in einem Bericht MAC-Adressen mit Ports und in einem anderen MAC-Adressen mit IP-Adressen abzugleichen. Wenn Sie „vorher“ und „während“ vergleichen, werden Sie vermutlich einige Unterschiede feststellen.

Vorausgesetzt, zwischen Ihrem 6509 und dem Rechenzentrum des Unternehmens befindet sich ein Router, werden Sie meiner Vorhersage nach feststellen, dass die MAC-Adresse dieses Routers zwischen den Ports „wandert“ oder dass seine IP-Adresse zwischen den MAC-Adressen wandert.

Wenn kein Router vorhanden ist und die Maschinen im Rechenzentrum des Unternehmens auf Ebene 2 mit diesem 6509 kommunizieren, gehe ich davon aus, dass die Geräte selbst möglicherweise eine gewisse „Bewegung“ zwischen den Ports oder eine Bewegung von IP-Adressen zwischen MAC-Adressen aufweisen.

Antwort3

Wenn Sie auf dem angepingten Client einen Sniffer ausführen, sehen Sie alle Pings oder nur die Hälfte davon?

Was passiert, wenn Sie die Pings von verschiedenen Schnittstellen auf dem 6500 beziehen? Passiert dies bei Hosts, für die der 6500 das Standard-Gateway ist?

Wie sieht die Mac-Adresstabelle aus? Wie wäre es mit einem Traceroute? Und einem 'ping -r9 '?

Schließen Sie einen iOS-Fehler nicht aus, aber es könnten auch viele andere Dinge sein ...

Antwort4

Ich muss Peter und Evan zustimmen. Das klingt eher nach einem abprallenden Route/Port als nach einem Cache-Angriff. Besonders auf einem 65xx. Um Evans Kommentar zu verstärken: Achten Sie darauf, die (funktionierende) ARP-Tabelle zu erhalten, aber der einzige Eintrag, den Sie wirklich brauchen, ist der Next-Hop-Router. Haben Sie Multi-Path-Probleme ausgeschlossen? Ich habe gesehen, wie jemand gefragt hat, ob Sie ein dynamisches Routing-Protokoll (oder mehrere Gateways mit schwebenden statischen Routen) verwenden, aber ich habe Ihre Antwort nicht gesehen. Viel Glück!

verwandte Informationen