負荷がかかったときに Linux の速度が低下するのを防ぐにはどうすればよいですか?

Question

問題は、メモリが飽和状態になり、その結果、オペレーティングシステムがディスクキャッシュを解放し、プログラムとそのデータをスワップメモリにスワップする必要に迫られることです。

スワップは、物理メモリの制限に達したときにシステムの動作を継続させる方法です。負荷の軽いシステムでは、システムが動作を継続し、不足が発生したときにページアウトされ、必要なときにわずかな影響でページインされることを意味します。

ほとんどのオペレーティングシステムでは、プログラムとコードは「最も最近使われていない」という基準でスワップにフラッシュされます。メモリの負荷は変化し、「優先順位」は何がより重要であるかという主観的な判断の滑りやすい坂道であるため、メモリの「優先順位」について何らかの仮定を立てることは困難です。あるシステムにとってより重要なことは、別のシステムにとってはそれほど重要ではありません。コマンドラインプログラムは他のプログラムと同じであり、ユーザーが実行する他のプログラムと区別することは不可能です。

大量のメモリを使用する多数のプロセスがある高負荷のシステムでは、競合の問題が発生します。オペレーティングシステムがメモリを解放するために何かをディスクにページアウトしようとした瞬間、別のプロセスが既に他のページを要求しており、そのページを戻す必要があります。何かを戻す要求ごとに、他の何かが押し出されます。

10,000 のプロセスの中で、他のプログラム要求と同じように見える「システム」コマンドラインプログラム要求よりも優先すべきものをシステムがどうやって決定できるでしょうか?

もう 1 つの問題は、ハードドライブのシーク時間です。旧式の HDD の場合、ドライブヘッドを移動して読み取りまたは書き込みを開始する時間は、約 9.5 ミリ秒です。さまざまな領域に対して一度に多数の要求が発生すると、シーク時間が他のすべての時間よりも優先され、実際の有効時間と帯域幅が驚くほど小さな数値に減少します。SSD は役立ちますが、メモリが限られている場合は、それほど役に立ちません。

同様のボトルネックはシステム全体で発生し、さまざまな症状を呈します。オペレーティングシステムは多数の同時プログラムを管理できますが、それ自体は「単なる」プログラムであり、他のすべてのものの中で時間を必要とします。スワップファイルの使用は、最も極端なボトルネックの 1 つにすぎません。

このようにシステムを氾濫させて、システムがそれを「処理する」ことを期待するのは良い考えではありません。

常に、持っているメモリよりも多くのメモリを使用している場合は、メモリを追加購入する必要があります。データの読み取りまたは書き込みのためにハードドライブの時間を争うプロセスが何千もある場合は、負荷をより多くのマシンまたはドライブに分散する必要があります。

他の状況では、10,000 個のアクティブなプロセスがある場合、競合と非現実的な期待の両方の問題が発生します。

1 つの問題は、「niceness」が必ずしも常に低い優先度であるとは限らないことです。これはオペレーティングシステムのスケジューラに依存しており、プロセスを追加し続けると、特定のプロセスに割り当てられる時間の量を削減することになるため、公平で有用なシステムを実現するのに逆効果になる可能性があります。

Unix姉妹サイトのこの質問を参照してくださいナイスワークはどうですか？これは完全に公平なスケジューラについて説明しています。

CFS には、スケジューリング期間のターゲットレイテンシがあります。ターゲットレイテンシが小さいほど対話性は向上しますが、ターゲットレイテンシが小さくなると、スイッチングオーバーヘッドが増加し、全体的なスループットが低下します。

...

ここで、niceness が 0 (デフォルト) のプロセスと、niceness が 5 のプロセスの 2 つを考えてみましょう。対応する重みの比例差はおよそ 1/3 です。つまり、優先度の高いプロセスは約 15 ミリ秒のタイムスライスを受け取り、優先度の低いプロセスは 5 ミリ秒のタイムスライスを受け取ります。

このスケジューラでは、nicenessは10,000のプロセスがすべき時間は短くなりますが、その数が多すぎるため、「公平な」スケジュールのタイムスライス値の下限に達し、十分なサイズのタイムスライスを誰も得られない可能性があります。CPU へのタスクのプルまたは CPU からのプルが時間の大半を占めるという制限に達する可能性もあります。

これは事実上、ハードドライブの競合と同じです。特定のプロセスで作業する有効な時間よりも、プロセス間の切り替えに多くの時間を費やすようにシステムを強制することになります。

スケジューラの詳細については、詳しくは、man7.org/linux/man-pages/man7/sched.7.html を参照してください。

より適切な数のプロセス (100 ～ 200) を使用すると、OS タスクとプロセスの間で適切な時間が分割されます。

一度に 10,000 個のタスクを開始するのではなく、古いタスクが終了するたびに新しいタスクを開始する必要があります。

Answer 1