我有一系列虛擬伺服器。我正在運行一個命令來登入每個帳戶並使用正常運行時間查看負載平均值。
確定負載值是否代表過載的最佳方法是什麼?我在機架空間雲上運行,因此伺服器具有突發能力並且可以是不同的大小。
我有點困惑如何想出一致的方法來確定何時需要啟動新伺服器。我可以做一些事情,例如估計每個實例上運行的作業,但我想要一個運行得更接近每個實例上可用的實際資源使用情況的系統,因為它顯然變化很大!
幫助非常感謝!
答案1
Linux CPU 負載平均值告訴您這一點,請查看有關負載平均值的網路教學。 http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages
追蹤多台電腦上的資源(如 CPU 等級)的一個好方法是使用 SNMP(簡單網路管理協定),它可以為您提供幾乎所有您想要的統計信息,並且會自動更新。
答案2
您使用哪種虛擬化解決方案?大多數企業虛擬化解決方案都有自己的報告、管理和容量規劃工具,例如:
答案3
我使用 Cacti 來監視和繪製伺服器負載圖(除其他外)。
對於大多數伺服器,我使用“更好的仙人掌模板”,它可以透過 SSH 連接並收集負載、CPU 使用情況、記憶體、磁碟 IO 等資料。
留意仙人掌圖中的尖峰,並仔細瀏覽日誌,找出當時發生的情況導致尖峰。
http://code.google.com/p/mysql-cacti-templates
我還使用 Nagios 透過電子郵件和簡訊發出狀態警報。