1 つの CPU でマルチスレッド プログラムのパフォーマンスをテストする必要がありますが、デュアル CPU マシンを使用しています。ソケットを共有する論理 CPU にアフィニティを設定する必要があります。そうしないと、FSB の数が多いほど大きなメリットが得られます。アフィニティ 0 ~ 7 と 8 ~ 15 を試しましたが、結果はかなり異なり、最初の方が高速です。そのため、どの論理 CPU がソケットを共有しているかわかりません。
lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 16
On-line CPU(s) list: 0-15
Thread(s) per core: 1
Core(s) per socket: 8
CPU socket(s): 2
NUMA node(s): 4
Vendor ID: AuthenticAMD
CPU family: 16
Model: 9
Stepping: 1
CPU MHz: 800.000
BogoMIPS: 4000.40
Virtualization: AMD-V
L1d cache: 64K
L1i cache: 64K
L2 cache: 512K
L3 cache: 5118K
NUMA node0 CPU(s): 0-3
NUMA node1 CPU(s): 4-7
NUMA node2 CPU(s): 12-15
NUMA node3 CPU(s): 8-11
~]$ cat /proc/cpuinfo | grep 'core id'
core id : 0
core id : 1
core id : 2
core id : 3
core id : 0
core id : 1
core id : 2
core id : 3
core id : 0
core id : 1
core id : 2
core id : 3
core id : 0
core id : 1
core id : 2
core id : 3
答え1
最初の 8 つのプロセッサは 1 つのチップからのものであり、次の 8 つのプロセッサは別のチップからのものです。 によって区別できますphysical id
。パフォーマンスの違いについては、現時点ではわかりません。
答え2
2 つの CPU のレイテンシは重要です。マザーボードのデータシートを読むと、そのうちの 1 つがプラットフォームを実行するために不可欠であることがわかります。
たとえば、socket0 と socket0、socket1 を設定することでプラットフォームを実行できますが、socket1 のみを設定することでプラットフォームを実行することはできません。
そのため、それぞれに異なるパフォーマンスがあります。いずれにしても、それらは類似しているはずですが、同一にはなりません。