AMD EPYC 7413 desacelera para cerca de 400 MHz ao executar o iperf

AMD EPYC 7413 desacelera para cerca de 400 MHz ao executar o iperf

estamos tentando configurar uma conexão de 40 Gbit entre dois servidores e obter um comportamento estranho da CPU ao usar o iperf. Ele também está usando apenas cerca de 10 Gbit/s dos 40 possíveis.

Especificações do servidor:

  • AMD EPYC7413
  • 8x MultiBitECC 3200 MHz 16384 MB de memória
  • Supermicro H12SSL-CT
  • Intel XL710 40GBe
  • Ubuntu 20.04.3 LTS 5.4.0-84-gene

Os servidores estão conectados diretamente entre si via fibra. Sem interruptores.

Exemplo

host1# iperf -s
host2# iperf -c host1 -i 1 -t 120
[ ID] Interval Transfer Bandwidth
[ 3] 0.0- 1.0 sec 1.39 GBytes 12.0 Gbits/sec
[ 3] 1.0- 2.0 sec 1.00 GBytes 8.61 Gbits/sec
[ 3] 2.0- 3.0 sec 1.03 GBytes 8.88 Gbits/sec
[ 3] 3.0- 4.0 sec 1.04 GBytes 8.92 Gbits/sec
[ 3] 4.0- 5.0 sec 1021 MBytes 8.56 Gbits/sec
[ 3] 5.0- 6.0 sec 1.05 GBytes 9.01 Gbits/sec
[ 3] 6.0- 7.0 sec 1.02 GBytes 8.78 Gbits/sec
[ 3] 7.0- 8.0 sec 1.02 GBytes 8.74 Gbits/sec
[ 3] 8.0- 9.0 sec 1.01 GBytes 8.69 Gbits/sec
[ 3] 9.0-10.0 sec 1.02 GBytes 8.75 Gbits/sec
[ 3] 10.0-11.0 sec 1.05 GBytes 9.03 Gbits/sec
[ 3] 11.0-12.0 sec 1015 MBytes 8.51 Gbits/sec
[ 3] 12.0-13.0 sec 1.02 GBytes 8.72 Gbits/sec
[ 3] 13.0-14.0 sec 1014 MBytes 8.51 Gbits/sec
[ 3] 14.0-15.0 sec 974 MBytes 8.17 Gbits/sec
[ 3] 0.0-15.0 sec 15.6 GBytes 8.92 Gbits/sec

Na internet encontrei o guia oficial de ajuste de desempenho deAMDe algo defastdata.es.net

Eles sugerem fazer certas configurações do sistema, como alterar o governador da CPU e o buffer tcp. Fiz as alterações de acordo e obtive apenas uma melhoria de 1 Gbit/s.

Quando verifiquei a velocidade do clock da CPU, a CPU sempre atingiu cerca de 400 MHz ao executar o iperf.

Alguma sugestão de por que o iperf faz a CPU dormir ou como eu poderia melhorar a velocidade de transmissão tcp de thread único? A execução de vários threads TCP utiliza melhor a largura de banda, mas não é nosso caso de uso.

obrigado

Responder1

Alterei o controle Global C-State no BIOS de automático para desativado e configurei

taxa de transferência de rede do perfil de adm sintonizado

Não tenho certeza se é a solução final, mas funciona por enquanto.

Editar:

No final, uma atualização do BIOS também foi necessária. No entanto, o tuned-adm ainda fornece um aumento de desempenho.

informação relacionada