我想監控Linux機器一段時間內的運作進程。
我自己動手的解決方案是:
將每分鐘轉儲 ps aux --forest
到文件中。
背景:如果我收到一條訊息“昨天大約 8 點左右出了點問題”,我想看看發生了什麼。
有很多工具可以總結負載和 io 值,但我需要更多詳細資訊。
我可以像上面的轉儲那樣做臨時管道ps
,但我想還有更好的解決方案。
哪個工具可以幫助我?
關閉
這個問題已經結束,因為我需要一個工具。我在這裡問了同樣的問題:
https://softwarerecs.stackexchange.com/questions/20459/monitoring-processes-in-detail-not-summarized
答案1
您必須意識到,監控的粒度太細會對您的系統效能產生負面影響。這就是您通常監控伺服器和服務的整體運作狀況並另外關注的原因具體績效指標與您的服務相關的。
那你就不應該處理「某物昨晚錯了」但你會知道確切地幾乎出了什麼問題一旦發生」。
但是,如果您確實想要監視系統的排序進程而不是服務,那麼更「正確」的方法之一是使用審核守護程序。
就像是:
auditctl -a exit,always -S execve
它將記錄任何啟動的程序(透過execve
系統呼叫)。