Linux カーネルによってスレッドに割り当てられるアフィニティが常に変化することは、全体的なパフォーマンスに悪影響を与えませんか?

Question 1

すべてのスレッドを 1 つのコアで実行する場合には、1 つのコアを搭載した安価なハードウェアを購入してください。

スケジューラは、すべてのコアを最大限に活用しようとします。つまり、空き時間があるコアにスレッドをディスパッチするということです。スレッドをあるコアから別のコアに移動するとコストが少しかかるため、スケジューラはこれを回避しようとします。ただし、コアをアイドル状態にしないことの利点は、スレッドを移行するコストよりもはるかに大きいため、通常はそれほど気になりません。これは、スレッドがコアローカルキャッシュよりも多くのメモリを使用する場合に特に当てはまります。スレッドが使用するメモリがコアローカルキャッシュにない場合、別のコアに移行しても失われるものはほとんどありません。

Linux のような産業グレードのスケジューラを推測すると、通常はパフォーマンスが低下します。

示されたグラフは、さまざまなコアの負荷が最大ではなく、わずかに変動していることを示しています。これは、システム全体が CPU パワーではなく、現在実行中のタスクの I/O によって制限されているためと考えられます。スレッドが 1 つのコアから別のコアに移動する頻度については、何ら言及されていません。

Answer

すべてのスレッドを 1 つのコアで実行する場合には、1 つのコアを搭載した安価なハードウェアを購入してください。

スケジューラは、すべてのコアを最大限に活用しようとします。つまり、空き時間があるコアにスレッドをディスパッチするということです。スレッドをあるコアから別のコアに移動するとコストが少しかかるため、スケジューラはこれを回避しようとします。ただし、コアをアイドル状態にしないことの利点は、スレッドを移行するコストよりもはるかに大きいため、通常はそれほど気になりません。これは、スレッドがコアローカルキャッシュよりも多くのメモリを使用する場合に特に当てはまります。スレッドが使用するメモリがコアローカルキャッシュにない場合、別のコアに移行しても失われるものはほとんどありません。

Linux のような産業グレードのスケジューラを推測すると、通常はパフォーマンスが低下します。

示されたグラフは、さまざまなコアの負荷が最大ではなく、わずかに変動していることを示しています。これは、システム全体が CPU パワーではなく、現在実行中のタスクの I/O によって制限されているためと考えられます。スレッドが 1 つのコアから別のコアに移動する頻度については、何ら言及されていません。

Question 2

ここで提供されるスナップショットは、カーネルのタイプ (バージョン) にも依存します。バージョン 2.4 の古いカーネルは親和性が低く、スレッドのピンポン動作が頻繁に発生してシステムのパフォーマンスに影響を及ぼしていました。カーネルバージョン 2.5 以降は親和性が比較的優れています。

マルチコアベースのシステムでは、アフィニティを設定すると、コア間でスレッドを移動する際にキャッシュの無効化が発生するのを回避し、パフォーマンスを向上させることができます。

Linux ベースのマルチコアシステムの場合、プロセスの場合は sched_setaffinity/taskset、スレッドの場合は pthread_setaffinity_np を使用して、アプリケーション/要件のタイプに基づいてスケジューラのアフィニティ動作 (自然アフィニティ) をオーバーライドできます。

カーネルシャークマルチコアシステムとアフィニティの視覚的表現が改善されているようです。

また、hトップアフィニティを設定するための視覚的なサポートを提供します (スケジューラをオーバーライドするため)。

Answer