Verbindungsverlust bei VLAN- und VSphere-Rechnern

Question

Gemäß dem Kommentar von Zac67 haben wir die NIC-Teaming-Konfiguration auf allen drei Hosts überprüft und dabei festgestellt, dass die ersten beiden den Parameter „Route basierend auf IP-Hash“ verwendeten, während der dritte Host „Route basierend auf dem ursprünglichen virtuellen Port“ verwendete.

Anschließend setzen wir den dritten Host auf den gleichen Wert wie die anderen und lesen die mit der ersten Option verbundene Warnung, die besagt: „Die Link-Aggregation sollte auf dem physischen Switch eingerichtet werden.“

Wir gingen daher zurück zum Switch und aktivierten die Link Aggregation für die entsprechenden Ports erneut, allerdings wurde dadurch die gesamte Konnektivität instabil, Maschinen im 192.168.9.0/24Netzwerk waren teilweise nicht erreichbar, während sich für die Personen im Netzwerk nichts änderte 10.10.10.0/24.

Daher entschieden wir uns für den umgekehrten Weg, deaktivierten die Link Aggregation auf den Switches und verwendeten auf allen drei Hosts die Option „Route basierend auf dem ursprünglichen virtuellen Port“.

Dadurch konnte das normale Verhalten des Netzwerks wiederhergestellt 192.168.9.0/24und die Konnektivität verbessert werden 10.10.10.0/24. Ich sage „besser“, weil einige Maschinen immer noch nicht erreichbar waren, nämlich diejenigen, Host3die den DHCP-Server nicht einmal erreichen konnten, um eine IP abzurufen.
Als wir den Datenverkehr mit Wireshark beobachteten, stellten wir fest, dass ARP-Broadcasts manchmal gefiltert wurden. Dies erklärte, warum einige Maschinen nicht miteinander kommunizieren konnten, gab uns aber noch immer keinen Hinweis auf eine mögliche Lösung.

Nachdem wir einige Wochen lang ohne Hoffnung auf eine Antwort daran festhingen, zogen wir die Berater hinzu, die uns bei der Installation der Infrastruktur geholfen hatten. Sie sagten uns zwei Dinge:

LACP ist nicht mit VLANs kompatibel
VLAN 42 wurde auf einem der Switch-Ports verboten

Indem sichergestellt wurde, dass die Konfiguration LACP überhaupt nicht verwendete, und die Einschränkung des Ports entfernt wurde, konnte eine voll funktionsfähige Situation geschaffen werden.

Nun fragen wir uns, wie wir es geschafft haben, VLAN 42 nur auf einem Port des Switches zu verbieten.

Was die LACP- und VLAN-Inkompatibilität betrifft, sind wir nie auf die Idee gekommen, dass dies die Ursache unserer Probleme sein könnte, aber jetzt, wo sie uns davon erzählt haben, scheint es ein bekanntes Problem beim Stapeln von DELL-Switches zu sein, aber ich konnte keine endgültige Antwort zu diesem Thema finden. Aber da es ohne funktioniert, ist für mich alles in Ordnung.

Answer 1

Gemäß dem Kommentar von Zac67 haben wir die NIC-Teaming-Konfiguration auf allen drei Hosts überprüft und dabei festgestellt, dass die ersten beiden den Parameter „Route basierend auf IP-Hash“ verwendeten, während der dritte Host „Route basierend auf dem ursprünglichen virtuellen Port“ verwendete.

Anschließend setzen wir den dritten Host auf den gleichen Wert wie die anderen und lesen die mit der ersten Option verbundene Warnung, die besagt: „Die Link-Aggregation sollte auf dem physischen Switch eingerichtet werden.“

Wir gingen daher zurück zum Switch und aktivierten die Link Aggregation für die entsprechenden Ports erneut, allerdings wurde dadurch die gesamte Konnektivität instabil, Maschinen im 192.168.9.0/24Netzwerk waren teilweise nicht erreichbar, während sich für die Personen im Netzwerk nichts änderte 10.10.10.0/24.

Daher entschieden wir uns für den umgekehrten Weg, deaktivierten die Link Aggregation auf den Switches und verwendeten auf allen drei Hosts die Option „Route basierend auf dem ursprünglichen virtuellen Port“.

Dadurch konnte das normale Verhalten des Netzwerks wiederhergestellt 192.168.9.0/24und die Konnektivität verbessert werden 10.10.10.0/24. Ich sage „besser“, weil einige Maschinen immer noch nicht erreichbar waren, nämlich diejenigen, Host3die den DHCP-Server nicht einmal erreichen konnten, um eine IP abzurufen.
Als wir den Datenverkehr mit Wireshark beobachteten, stellten wir fest, dass ARP-Broadcasts manchmal gefiltert wurden. Dies erklärte, warum einige Maschinen nicht miteinander kommunizieren konnten, gab uns aber noch immer keinen Hinweis auf eine mögliche Lösung.

Nachdem wir einige Wochen lang ohne Hoffnung auf eine Antwort daran festhingen, zogen wir die Berater hinzu, die uns bei der Installation der Infrastruktur geholfen hatten. Sie sagten uns zwei Dinge:

LACP ist nicht mit VLANs kompatibel
VLAN 42 wurde auf einem der Switch-Ports verboten

Indem sichergestellt wurde, dass die Konfiguration LACP überhaupt nicht verwendete, und die Einschränkung des Ports entfernt wurde, konnte eine voll funktionsfähige Situation geschaffen werden.

Nun fragen wir uns, wie wir es geschafft haben, VLAN 42 nur auf einem Port des Switches zu verbieten.

Was die LACP- und VLAN-Inkompatibilität betrifft, sind wir nie auf die Idee gekommen, dass dies die Ursache unserer Probleme sein könnte, aber jetzt, wo sie uns davon erzählt haben, scheint es ein bekanntes Problem beim Stapeln von DELL-Switches zu sein, aber ich konnte keine endgültige Antwort zu diesem Thema finden. Aber da es ohne funktioniert, ist für mich alles in Ordnung.

Verbindungsverlust bei VLAN- und VSphere-Rechnern

Antwort1

verwandte Informationen