説明なしにサーバーが100%稼働中

説明なしにサーバーが100%稼働中

私は Ubuntu VPS を持っていますが、最近プロセッサをフルに活用したために応答しなくなってしまいました。

残念ながら、何が原因なのかわからず困っています。問題の原因を特定して解決するためのヒントを探していました。

  • ロックしたときに何が実行されていたのかわかりませんが、それを調べる方法はあるでしょうか?
  • 次回問題が発生したときに診断できるようにするには、どのような手順やログ記録を実施すればよいでしょうか?

答え1

私の会社では、各サーバーに負荷平均をチェックする簡単な cron スクリプトがあります。負荷平均が特定のポイントを超えて上昇し始めると、電子メールが送信されるので、サーバーにログインして問題のあるプロセスを探すことができます。が、 top私が最初に入力したコマンドです。

5 分間の負荷平均をチェックしていると思いますが、サーバーがすぐに過負荷になっている場合は、1 分間の負荷平均を監視するスクリプトが必要になる場合があります。

関連情報