Windows 7 での 10GBASE-T のパフォーマンス

Question

表示された提案を試してくださいここ

RSS (受信側スケーリング)、LSO (大規模送信/セグメントオフロード)、TCP ウィンドウスケーリング (自動チューニング)、TCP Chimney (Windows の場合)、オプションで RSC (受信側結合) が適切にセットアップされ、構成されている必要があります。

最新のプロセッサでも、1 つのプロセッサコアで 10 GB 相当の読み取りを処理できないため、RSS は、受信負荷を複数のプロセッサに分散するために、プロセッサに応じて少なくとも 4 つの物理プロセッサコア (RSS はハイパースレッド論理コアでは動作しません)、場合によっては 8 つの物理プロセッサコアでセットアップする必要があります。これは、PowerShell (Windows) の Set-NetAdapterRss コマンドレットを使用して実行できます。

ハイパースレッディング付きの 4 つの物理コアプロセッサのコマンド例 (0、2、4、6 は物理、1、3、5、7 は論理.... ほぼ経験則) Set-NetAdapterRss -Name "" -NumberOfReceiveQueues 4 -BaseProcessorNumber 0 -MaxProcessorNumber 6 -MaxProcessors 4 -Enabled

LSO は NIC ドライバーおよび/または PowerShell で設定されます。これにより、Windows/Linux/その他で大きなパケット (たとえば 64KB-1MB) を作成し、NIC ハードウェアでデータを MSS 値にセグメント化できるようになります。これにより、ホストのプロセッサ使用率が下がり、ハードウェアでのセグメント化が高速化され、OS の作業が減るため、転送が高速化されます。

RSC は、Windows または Linux および NIC で設定されます。これは LSO の逆の動作を行います。小さなチャンクが NIC によって受信され、1 つの大きなパケットにされて OS に送信されます。受信側のプロセッサオーバーヘッドが削減されます。

TCP Chimney は 1Gb の世界では評判が悪いですが、10Gb の世界では優れています。Windows 8+/2012+ で自動に設定すると、特定の状況下で 10Gb ネットワークでのみ有効になります。

TCP ウィンドウスケーリング (Windows の世界では自動調整) は絶対に必要です。これがないと、TCP ウィンドウは 10Gb 接続で高いスループットを維持できるほど大きくなりません。

9K ジャンボフレームを有効にします (有効にしないという人もいれば、有効にすると言う人もいます... 実際にはハードウェアに依存するため、両方の方法でテストしてください)。

私のハードウェアでは、ジャンボフレームを有効にすることが重要でした。IRQ 合体設定にも特に注意してください。

Answer 1

表示された提案を試してくださいここ

RSS (受信側スケーリング)、LSO (大規模送信/セグメントオフロード)、TCP ウィンドウスケーリング (自動チューニング)、TCP Chimney (Windows の場合)、オプションで RSC (受信側結合) が適切にセットアップされ、構成されている必要があります。

最新のプロセッサでも、1 つのプロセッサコアで 10 GB 相当の読み取りを処理できないため、RSS は、受信負荷を複数のプロセッサに分散するために、プロセッサに応じて少なくとも 4 つの物理プロセッサコア (RSS はハイパースレッド論理コアでは動作しません)、場合によっては 8 つの物理プロセッサコアでセットアップする必要があります。これは、PowerShell (Windows) の Set-NetAdapterRss コマンドレットを使用して実行できます。

ハイパースレッディング付きの 4 つの物理コアプロセッサのコマンド例 (0、2、4、6 は物理、1、3、5、7 は論理.... ほぼ経験則) Set-NetAdapterRss -Name "" -NumberOfReceiveQueues 4 -BaseProcessorNumber 0 -MaxProcessorNumber 6 -MaxProcessors 4 -Enabled

LSO は NIC ドライバーおよび/または PowerShell で設定されます。これにより、Windows/Linux/その他で大きなパケット (たとえば 64KB-1MB) を作成し、NIC ハードウェアでデータを MSS 値にセグメント化できるようになります。これにより、ホストのプロセッサ使用率が下がり、ハードウェアでのセグメント化が高速化され、OS の作業が減るため、転送が高速化されます。

RSC は、Windows または Linux および NIC で設定されます。これは LSO の逆の動作を行います。小さなチャンクが NIC によって受信され、1 つの大きなパケットにされて OS に送信されます。受信側のプロセッサオーバーヘッドが削減されます。

TCP Chimney は 1Gb の世界では評判が悪いですが、10Gb の世界では優れています。Windows 8+/2012+ で自動に設定すると、特定の状況下で 10Gb ネットワークでのみ有効になります。

TCP ウィンドウスケーリング (Windows の世界では自動調整) は絶対に必要です。これがないと、TCP ウィンドウは 10Gb 接続で高いスループットを維持できるほど大きくなりません。

9K ジャンボフレームを有効にします (有効にしないという人もいれば、有効にすると言う人もいます... 実際にはハードウェアに依存するため、両方の方法でテストしてください)。

私のハードウェアでは、ジャンボフレームを有効にすることが重要でした。IRQ 合体設定にも特に注意してください。

Windows 7 での 10GBASE-T のパフォーマンス

答え1

関連情報