AMD EPYC 7413 verlangsamt sich beim Ausführen von iperf auf etwa 400 MHz

AMD EPYC 7413 verlangsamt sich beim Ausführen von iperf auf etwa 400 MHz

Wir versuchen, eine 40-GBit-Verbindung zwischen zwei Servern einzurichten, und bei Verwendung von iperf tritt ein seltsames CPU-Verhalten auf. Außerdem werden nur etwa 10 der möglichen 40 Gbit/s genutzt.

Serverspezifikationen:

  • AMD EPYC 7413
  • 8x MultiBitECC 3200 MHz 16384 MB Speicher
  • Supermicro H12SSL-CT
  • Intel XL710 40 GBe
  • Ubuntu 20.04.3 LTS 5.4.0-84-Gen

Die Server sind über Glasfaser direkt miteinander verbunden. Keine Switches.

Beispiel

host1# iperf -s
host2# iperf -c host1 -i 1 -t 120
[ ID] Interval Transfer Bandwidth
[ 3] 0.0- 1.0 sec 1.39 GBytes 12.0 Gbits/sec
[ 3] 1.0- 2.0 sec 1.00 GBytes 8.61 Gbits/sec
[ 3] 2.0- 3.0 sec 1.03 GBytes 8.88 Gbits/sec
[ 3] 3.0- 4.0 sec 1.04 GBytes 8.92 Gbits/sec
[ 3] 4.0- 5.0 sec 1021 MBytes 8.56 Gbits/sec
[ 3] 5.0- 6.0 sec 1.05 GBytes 9.01 Gbits/sec
[ 3] 6.0- 7.0 sec 1.02 GBytes 8.78 Gbits/sec
[ 3] 7.0- 8.0 sec 1.02 GBytes 8.74 Gbits/sec
[ 3] 8.0- 9.0 sec 1.01 GBytes 8.69 Gbits/sec
[ 3] 9.0-10.0 sec 1.02 GBytes 8.75 Gbits/sec
[ 3] 10.0-11.0 sec 1.05 GBytes 9.03 Gbits/sec
[ 3] 11.0-12.0 sec 1015 MBytes 8.51 Gbits/sec
[ 3] 12.0-13.0 sec 1.02 GBytes 8.72 Gbits/sec
[ 3] 13.0-14.0 sec 1014 MBytes 8.51 Gbits/sec
[ 3] 14.0-15.0 sec 974 MBytes 8.17 Gbits/sec
[ 3] 0.0-15.0 sec 15.6 GBytes 8.92 Gbits/sec

Im Internet fand ich den offiziellen Leistungsoptimierungsleitfaden vonAMDund etwas vonfasterdata.es.net

Sie schlagen vor, bestimmte Systemeinstellungen vorzunehmen, z. B. den CPU-Regler und den TCP-Puffer zu ändern. Ich habe die Änderungen entsprechend vorgenommen und nur eine Verbesserung von 1 Gbit/s erzielt.

Als ich die CPU-Taktrate überprüft habe, wurde die CPU beim Ausführen von iperf immer auf etwa 400 MHz heruntergetaktet.

Irgendwelche Vorschläge, warum iperf die CPU in den Ruhezustand versetzt oder wie ich die Übertragungsgeschwindigkeit eines einzelnen Threads im TCP-Verfahren verbessern könnte? Das Ausführen mehrerer TCP-Threads nutzt die Bandbreite besser, ist aber nicht unser Anwendungsfall.

Danke

Antwort1

Ich habe die globale C-State-Steuerung im BIOS von automatisch auf deaktiviert geändert und

Tuned-ADM-Profil Netzwerkdurchsatz

Ich bin nicht sicher, ob es die endgültige Lösung ist, aber im Moment funktioniert es.

Bearbeiten:

Schlussendlich war auch noch ein Biosupdate nötig. tuned-adm sorgt allerdings dennoch für eine Leistungssteigerung.

verwandte Informationen