
我在遠端資料庫伺服器上使用 NRPE 運行check_mysql
插件,雖然我可以獲得關於伺服器是否運行的令人滿意的數據流程正在根據需要工作,我看到該插件輸出了更多資訊:
user@server:/etc/nagios# /usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -psnip
Uptime: 112398 Threads: 5 Questions: 10921804 Slow queries: 0 Opens: 4408 Flush tables: 1 Open tables: 416 Queries per second avg: 97.170|Connections=137481c;;; Open_files=0;;; Open_tables=416;;; Qcache_free_memory=1031832;;; Qcache_hits=0c;;; Qcache_inserts=0c;;; Qcache_lowmem_prunes=0c;;; Qcache_not_cached=9427651c;;; Qcache_queries_in_cache=0;;; Queries=10921805c;;; Questions=10917613c;;; Table_locks_waited=0c;;; Threads_connected=5;;; Threads_running=1;;; Uptime=112398c;;;
這讓我認為我可以斷言諸如線程數量或慢速查詢之類的事情來產生警報狀態。
問題是,我該怎麼做?此插件的-w
和-c
參數僅處理主從時鐘漂移,而不處理其他參數。
我是否需要編寫一些自訂 shell 腳本來解析輸出然後返回自己的輸出?或者 Nagios Core 中是否有內建設施可以進行此類處理?
答案1
最後,我決定最好的做法是按照插件規範編寫一些自訂腳本,並使用awk
.供日後參考(警告實施者):
#! /bin/bash
parse_mysql_output(){
METRIC=`/usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -p[REDACTED] | grep -shoP "${METRIC_NAME}: ([\d.]+)" | awk -F ': ' '{print $2}'`
if (($(echo "$METRIC <= $WARNING_THRESHOLD" | bc -l))); then
echo "OK - $METRIC_NAME: $METRIC"
exit 0
fi
if (($(echo "$METRIC > $WARNING_THRESHOLD" | bc -l))); then
if (($(echo "$METRIC <= $CRITICAL_THRESHOLD" | bc -l))); then
echo "WARNING - $METRIC_NAME: $METRIC"
exit 1
fi
fi
if (($(echo "$METRIC >= $CRITICAL_THRESHOLD" | bc -l))); then
echo "CRITICAL - $METRIC_NAME: $METRIC"
exit 2
fi
echo "INDETERMINATE STATE - $METRIC_NAME: $METRIC"
exit 3
}
if [[ -z "$1" || -z "$2" || -z "$3" ]]
then
echo "Missing parameters! Syntax: ./`basename $0` metric warning_threshold critical_threshold"
exit 3
else
METRIC_NAME=$1
WARNING_THRESHOLD=$2
CRITICAL_THRESHOLD=$3
fi
parse_mysql_output
在預期的用例中,您可以透過 NRPE 配置中的自訂命令呼叫它,並傳遞指標和閾值。在呼叫之前,您需要根據安裝需要更改連接。
歡迎反饋和評論。