Linux ページキャッシュにより、64 GB RAM を搭載したデュアル CPU サーバーでの IO が遅くなる

Question

発生している動作は、Linux が NUMA システム上でメモリを割り当てる方法によるものです。

私は、32GB システムが非 NUMA であるか、Linux が考慮するほど NUMA が十分ではないと (知らずに) 想定しています。

NUMA の処理方法は/proc/sys/vm/zone_reclaim_modeオプションによって決まります。デフォルトでは、Linux は NUMA システムを使用しているかどうかを検出し、パフォーマンスが向上すると思われる場合は再利用フラグを変更します。

メモリはゾーンに分割されており、NUMA システムでは最初の CPU ソケット用のゾーンと 2 番目の CPU ソケット用のゾーンがあります。これらはおよびとして表示されますnode0。node1cat を実行すると確認できます/proc/buddyinfo。

ゾーン再利用モードが 1 に設定されている場合、最初の CPU ソケットからの割り当てにより、その CPU に関連付けられたメモリゾーンで再利用が行われます。これは、ローカル NUMA ノードから再利用する方がパフォーマンスの点で効率的であるためです。この意味での再利用とは、キャッシュをクリアするなどページをドロップしたり、そのノードでスワップアウトしたりすることです。

値を 0 に設定すると、ゾーンがいっぱいになった場合に再利用は行われず、代わりにメモリの外部 NUMA ゾーンに割り当てられます。これには、そのメモリゾーンへの排他的アクセスを取得するために他の CPU が短時間ロックされるというコストがかかります。

しかし、すぐにスワップが始まります! 数秒後: メモリ: 合計 66004536k、使用済み 65733796k、空き 270740k、バッファ 34250384k スワップ: 合計 10239992k、使用済み 1178820k、空き 9061172k、キャッシュ済み 91388k

スワッピングの動作とスワップするタイミングは、いくつかの要因によって決まります。その 1 つは、アプリケーションに割り当てられたページがどれだけアクティブであるかです。あまりアクティブでない場合は、キャッシュで発生しているより忙しい作業にスワップされます。VM 内のページがアクティブ化されることはあまりないと思います。

Answer 1