OpenNebula (KVM) + OpenvSwitch, hohe CPU-Auslastung bei hoher Bandbreitennutzung

Question 1

Alles, was über eine virtuelle Brücke laufen muss, wird ziemlich hart getroffen. Das gilt für OVS und Linux-Bridging, da beide eine Paketprüfung im Promiscuous-Modus durchführen müssen, um zu bestimmen, wohin die Dinge gehen müssen (im Wesentlichen ein Layer-2-Switch).

In Hochleistungsszenarien, wie z. B. mit 10-Gigabit-Ethernet, ist es manchmal ratsam, SRV-IO-Geräte-Passthrough durchzuführen, anstatt das Host-Betriebssystem auf Layer 2 umschalten zu lassen. Dies hat den Nachteil, dass nur dieser eine Gast die übergebene Ethernet-Karte verwenden kann. PCI-Passthrough funktioniert bei Netzwerkkarten sehr gut, und KVM/libvirt ist hier hervorragend.

Macvtap kann den Datenverkehr auch fast ohne Overhead und ohne Verwendung von srv-io PCI-Passthrough direkt an eine Gast-VM weiterleiten (Sie müssen also keine Hardware für eine einzelne VM reservieren). Macvtap ist insofern eingeschränkt, als es niemals Host-Gast-Kommunikation oder sogar Gast-Gast-Kommunikation innerhalb desselben Hypervisors bereitstellen kann (da es dieselbe MAC-Adresse Ihres Hosts verwendet, anstatt für jeden Gast über einen virtuellen Switch eine andere zu verwenden). Eine Möglichkeit, dies zu umgehen, besteht darin, „Hairpinning“ auf Switch-Ebene durchzuführen (sofern Ihr Switch dies unterstützt), wodurch ein Gerät über eine Art Loopback auf einem einzelnen Port und einer einzelnen MAC-Adresse mit sich selbst kommunizieren kann.

Für die Kommunikation zwischen Host und Gast wird bei Verwendung einer der oben genannten Methoden häufig ein zusätzliches überbrücktes Netzwerk bereitgestellt, das nicht für Hochleistungskommunikation verwendet wird. Dies ist tatsächlich eine sehr gängige Konfiguration bei Verwendung von >=10Gib Ethernet auf VMs.

Answer

Alles, was über eine virtuelle Brücke laufen muss, wird ziemlich hart getroffen. Das gilt für OVS und Linux-Bridging, da beide eine Paketprüfung im Promiscuous-Modus durchführen müssen, um zu bestimmen, wohin die Dinge gehen müssen (im Wesentlichen ein Layer-2-Switch).

In Hochleistungsszenarien, wie z. B. mit 10-Gigabit-Ethernet, ist es manchmal ratsam, SRV-IO-Geräte-Passthrough durchzuführen, anstatt das Host-Betriebssystem auf Layer 2 umschalten zu lassen. Dies hat den Nachteil, dass nur dieser eine Gast die übergebene Ethernet-Karte verwenden kann. PCI-Passthrough funktioniert bei Netzwerkkarten sehr gut, und KVM/libvirt ist hier hervorragend.

Macvtap kann den Datenverkehr auch fast ohne Overhead und ohne Verwendung von srv-io PCI-Passthrough direkt an eine Gast-VM weiterleiten (Sie müssen also keine Hardware für eine einzelne VM reservieren). Macvtap ist insofern eingeschränkt, als es niemals Host-Gast-Kommunikation oder sogar Gast-Gast-Kommunikation innerhalb desselben Hypervisors bereitstellen kann (da es dieselbe MAC-Adresse Ihres Hosts verwendet, anstatt für jeden Gast über einen virtuellen Switch eine andere zu verwenden). Eine Möglichkeit, dies zu umgehen, besteht darin, „Hairpinning“ auf Switch-Ebene durchzuführen (sofern Ihr Switch dies unterstützt), wodurch ein Gerät über eine Art Loopback auf einem einzelnen Port und einer einzelnen MAC-Adresse mit sich selbst kommunizieren kann.

Für die Kommunikation zwischen Host und Gast wird bei Verwendung einer der oben genannten Methoden häufig ein zusätzliches überbrücktes Netzwerk bereitgestellt, das nicht für Hochleistungskommunikation verwendet wird. Dies ist tatsächlich eine sehr gängige Konfiguration bei Verwendung von >=10Gib Ethernet auf VMs.

Question 2

Eine große Optimierung, die ich erfolgreich (und einfach, ohne Austausch der Netzwerkkarte etc.) anwenden konnte, war die Verwendung des Virtio-Modells standardmäßig für alle Netzwerkkarten in der VM-Vorlage oder für jede Netzwerkkarte separat, wie beschriebenHier:

NIC_DEFAULT = [
  MODEL = "virtio" ]

Fahren Sie eine bereits instanziierte VM herunter, trennen Sie alle Netzwerkkarten und verbinden Sie sie mit dem Modell „virtio“ erneut.

Bei meinen ersten Tests erhöhte es die iperf3-Bandbreite zwischen Host und Gast auf 5,6 Gbit/s und verringerte die CPU-Last des Hosts während des Tests auf ~ 50–60 % pro QEMU-Thread (< 5 % bei fast 1 Gbit/s beim Ausführen des iperf3-Clients von einem über Gbit/s verbundenen Host).

Wenn Sie weitere Optimierungen kennen, fügen Sie diese gerne hinzu!

Answer

Eine große Optimierung, die ich erfolgreich (und einfach, ohne Austausch der Netzwerkkarte etc.) anwenden konnte, war die Verwendung des Virtio-Modells standardmäßig für alle Netzwerkkarten in der VM-Vorlage oder für jede Netzwerkkarte separat, wie beschriebenHier:

NIC_DEFAULT = [
  MODEL = "virtio" ]

Fahren Sie eine bereits instanziierte VM herunter, trennen Sie alle Netzwerkkarten und verbinden Sie sie mit dem Modell „virtio“ erneut.

Bei meinen ersten Tests erhöhte es die iperf3-Bandbreite zwischen Host und Gast auf 5,6 Gbit/s und verringerte die CPU-Last des Hosts während des Tests auf ~ 50–60 % pro QEMU-Thread (< 5 % bei fast 1 Gbit/s beim Ausführen des iperf3-Clients von einem über Gbit/s verbundenen Host).

Wenn Sie weitere Optimierungen kennen, fügen Sie diese gerne hinzu!

OpenNebula (KVM) + OpenvSwitch, hohe CPU-Auslastung bei hoher Bandbreitennutzung

Antwort1

Antwort2

verwandte Informationen