守護程式失敗並更改 pid 號

守護程式失敗並更改 pid 號

proftpd、sshd 和 apache 程序在 Linux 發行版上使用 /etc/init.d/its-script 運作。

我使用場監控服務監控 21、22 和 80 連接埠:每 5 分鐘服務檢查每個連接埠並僅通知故障。 24小時內故障5-6次。似乎有時有人會踢開關..

我新增了monit和collectd監控,對21、22和80埠的監控是每1分鐘一次。我沒有收到農場監控服務通知。我只收到有關 proftpd、sshd 或 apache 進程的失敗和/或成功/更改 pid 號碼的 monit 通知。 24小時內故障仍有5-6次。 collectd 監控 cpu、平均負載、以及每個行程是規律的,沒有峰值。沒有什麼可以觸發開關,但有一些東西可以決定故障監控。這是一個簡單的干擾還是表示存在某種異常?

什麼可能導致這些失敗?

答案1

這裡要做的事情是開始挖掘系統日誌,看看這些重新啟動的原因是否與有趣的事情有關。可能是您遇到了 Linux 記憶體不足殺手,或者進程崩潰時可能會拋出堆疊轉儲。這兩者都將在系統日誌中可見。

相關內容