Rendimiento de 10GBASE-T en Windows 7

Rendimiento de 10GBASE-T en Windows 7

Este es mi escenario:

-Estación de trabajo 1: CPU i7-3770 / 16 GB de ram / placa base Gigabyte Z77-D3H / Disco de sistema Crucial CT256MX100SSD1 / Adaptador de red intel X540-T1 / Windows 7 64bit - Estación de trabajo 2: CPU i7-950 / 12 GB de ram / placa base ASUS P6X58D-E / Crucial CT256MX100SSD1 Sysyem Disk/Adaptador de red intel X540-T1/Windows 7 64bit
-Switcher HP procurve 2920 con dos tarjetas dobles de expansión ethernet 10 Gigabit.

Ambos cables utp son Cat6 de menos de 15 metros y se conectan directamente desde cada estación de trabajo al conmutador hp. Ambos adaptadores de red parecen estar vinculados a 10 Gbps.

Estoy probando el rendimiento de la red con iperf:

-estación de trabajo1: iperf -s
-estación de trabajo2: iperf -c<workstation1 ip>

Obtengo alrededor de 1 Gbit por segundo en lugar de 10 Gbit por segundo. Entonces, ¿hay algún paso que esté haciendo mal? ¿Alguna información sobre las limitaciones de la red de Windows 7? Gracias.

ACTUALIZADO - Pruebas NTttcp

C:\NTttcp-v5.28\x64>NTttcp.exe -s -m 8,*,192.168.1.20 -l 128k -a 2 -t 15

Copyright Versión 5.28
La actividad de la red progresa...

Tiempo(s) de subproceso Rendimiento(KB/s) Promedio B/Compl.    
====== ======= ================ ==============    

0 15.001 38661.956 131072.000
1 14.999 38257.484 131072.000   
2 14.998 53989.065 131072.000   
3 14.998 38336.845 131072.000   
4 14.999 38086.806 131072.000   
5 15.000 37563.733 131072.000   
6 14.997 56408.082 131072.000   
7 15.000 52292.267 131072.000   


##### Totales: #####


Bytes (MEG) tiempo real (s) Rendimiento promedio del tamaño de trama (MB/s)    
=========== =========== ============== ============== ==  
5179.250000 15.000 1459.696 345.283   


>Rendimiento (búferes/s) ciclos/búferes de bytes    
===================== ============== ==========    
      2762.267 6.912 41434.000    


>DPC(recuento/s) Paquetes(núm/DPC) Intr(recuento/s) Paquetes(núm/intr)   
============= ============= =============== ========= =====   
    13668,933 1,633 22030,933 1,013   



>Paquetes enviados Paquetes recibidos Retransmisiones Errores Promedio. UPC %    
============= ================ =========== ====== ==== ======    
     3720525 334723 4364 0 10.179  

Respuesta1

Pruebe las sugerencias mostradasaquí

  1. Necesita que RSS (escalado del lado de recepción), LSO (descarga de envío/segmento grande), escalado de ventana TCP (ajuste automático) y TCP Chimney (para Windows), opcionalmente RSC (coalescencia del lado de recepción), estén configurados y configurados correctamente.

Incluso los procesadores modernos no pueden manejar 10 Gb de lecturas en un solo núcleo de procesador, por lo que RSS necesita configurarse con un mínimo de 4 núcleos de procesador físicos (RSS no funciona en núcleos lógicos Hyperthreaded), posiblemente 8, dependiendo del procesador, para distribuir la carga de recepción. en múltiples procesadores. Puede hacerlo a través de PowerShell (Windows) con el cmdlet Set-NetAdapterRss.

Comando de ejemplo para un proceso de 4 núcleos físicos con Hyerpthreading (0,2,4,6 son físicos, 1,3,5,7 son lógicos... prácticamente una regla general) Set-NetAdapterRss -Name "" - NumberOfReceiveQueues 4 -BaseProcessorNumber 0 -MaxProcessorNumber 6 -MaxProcessors 4 -Habilitado

LSO se configura en los controladores NIC y/o PowerShell. Esto permite que Windows/Linux/lo que sea cree un paquete grande (por ejemplo, 64 KB-1 MB) y permita que el hardware de la NIC se encargue de segmentar los datos al valor MSS. Esto reduce el uso del procesador en el host y acelera la transferencia, ya que la segmentación es más rápida en el hardware y el sistema operativo tiene que hacer menos trabajo.

RSC está configurado en Windows o Linux y en la NIC. Esto hace lo contrario de LSO. La NIC recibe fragmentos pequeños y los convierte en un paquete grande que se envía al sistema operativo. Reduce la sobrecarga del procesador en el lado de recepción.

Si bien TCP Chimney tiene mala reputación en el mundo de 1 Gb, brilla en el mundo de 10 Gb. Configúrelo en Automático en Windows 8+/2012+ y solo se habilitará en redes de 10 Gb en determinadas circunstancias.

El escalado de la ventana TCP (ajuste automático en el mundo de Windows) es una necesidad absoluta. Sin él, las ventanas TCP nunca crecerán lo suficiente como para mantener un alto rendimiento en una conexión de 10 Gb.

  1. Habilite fotogramas gigantes de 9K (algunas personas dicen que no, otras dicen que sí... realmente depende del hardware, así que pruebe en ambos sentidos).

En mi hardware, habilitar fotogramas gigantes era lo fundamental. Preste también especial atención al ajuste de fusión de IRQ.

información relacionada