少なくとも週に 1 回はパフォーマンスが非常に低下するサーバーがあります。メモリは約 10 ~ 15 GB スワップされ、サーバーには 36 GB の RAM があります。
私の質問は、サーバーがいつスワップ状態になったか、またはスワップ状態になった原因は何だったのかを知ることができるかどうかです。
問題を引き起こしているプロセスが 1 つあるような気がしますが、プロセス リストを確認するとすべて正常に見えます。ただし、この時点ではサーバーはすでにスワップ状態になっています。
答え1
これは swapiness について詳しく説明した良い記事のようです:
https://en.wikipedia.org/wiki/スワッピネス
しかし、パフォーマンスの低下はスワッピングによるものか、それとも「他の何か」によるものか疑問に思います。
スワッピングを行うのは、プログラムには時間の経過とともに変化する「ワーキング セット」があり、その目的は「不要なページ」をスワップアウトすることです。
既存の RAM の容量が十分でない場合に、システムは「スワッピングを開始」します。
動作が遅い場合は、実行キュー (実行したいプロセスの数) が多すぎることを示している可能性があります。メモリ負荷がユーザー/プログラムの関数である場合、より多くのユーザーがより多くのプログラムを実行したいことになります (システムが遅いときに偶然スワッピングが発生することもあります)。
これもかなり良さそうです:
http://www.tecmint.com/commands-to-monitor-swap-space-usage-in-linux/
(glances コマンドについては知りませんでした。常に新しいことを学んでいます)
これらは、問題の診断に役立つツールを示しています。