搜尋檢查記憶體使用情況的 Nagios 插件在給出了許多結果,因此很難知道該使用哪一個,因為 Nagios 插件包不包含用於檢查記憶體的插件。
所以我想知道其他人在使用哪些?
我在 Linux 主機上將 NRPE 與 Nagios 結合使用。
答案1
我強烈不同意 Glen M 的觀點——可用於快取和緩衝區的記憶體量對於確保幾乎每種類型的伺服器作業系統上的幾乎每種類型的應用程式的良好性能至關重要。
如果您等到網頁伺服器開始分頁才知道問題所在,那麼就為時已晚了。
在方便的工作站上,我可以看到:
total used free shared buffers cached
Mem: 4135700 2588568 1547132 0 91024 2309052
-/+ buffers/cache: 188492 3947208
Swap: 4192944 156 4192788
我想將使用報告為 100*[used-buffers/cache]/total,或 100*188492/4135700。
為此編寫一個插件並不完全費力。但有幾種產品可以涵蓋這一點 - 例如檢查內存.pl
要建立自己的,這裡有一個小提示:
PCTUSED=`free | awk '/^Mem:/ {tot=$2; } /buffers/ { used=$3; } END { print used*100/tot }'`
答案2
幾年前,我為此寫了一個外掛程式。
從根本上講,大多數作業系統的記憶體報告都有點錯誤——內容由應用程式持有,但如果需要,可以在任何給定時間釋放。
您可能真正關心的是您的系統必須多久去一次磁碟進行交換——即它是否開始抖動。
我使用 vmstat 和一些正規表示式(或者可能是帶有正規表示式的 python)來查看頁面輸入和頁面輸出,並查看它們是否通過了某個閾值。
這需要相當多的調整和監控,但這是我最好用的。為{nagios | 編寫外掛並不難。老大哥|西盟 |星期一}