一連の仮想サーバーがあります。各サーバーにログインし、uptime を使用して負荷平均を確認するコマンドを実行しています。
負荷値が過負荷を表しているかどうかを判断する最善の方法は何ですか? 私は Rackspace Cloud 上で実行しているので、サーバーにはバースト機能があり、さまざまなサイズにすることができます。
新しいサーバーを起動する必要がある時期を判断する一貫した方法を見つける方法が少しわかりません。各サーバーで実行されているジョブを見積もることなどはできますが、明らかにかなり異なるため、各インスタンスで使用可能な実際のリソース使用量にもう少し近い値で実行されるシステムが欲しいです。
ご協力をよろしくお願いします!
答え1
Linux CPU 負荷平均はまさにそのことを示しています。負荷平均に関するこの Web チュートリアルを確認してください。 http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages
複数のコンピューターのリソース (CPU レベルなど) を追跡する良い方法は、SNMP (Simple Network Management Protocol) を使用することです。SNMP を使用すると、必要な統計情報が得られ、自動的に更新されます。
答え2
どの仮想化ソリューションを使用していますか? ほとんどのエンタープライズ仮想化ソリューションには、次のような独自のレポート、管理、容量計画ツールがあります。
答え3
私は Cacti を使用して、サーバーの負荷を監視し、グラフ化します (他の用途もあります)。
ほとんどのサーバーでは、SSH 経由で接続し、負荷、CPU 使用率、メモリ、ディスク IO などのデータを収集できる「better cacti テンプレート」を使用します。
サボテン グラフのスパイクに注意し、ログを調べて、その時点で何が起こってスパイクが発生したのかを調べます。
http://code.google.com/p/mysql-cacti-templates
また、電子メールと SMS によるステータス アラートにも Nagios を使用します。