斷言來自 Nagios 的 check_mysql 的擴展信息

斷言來自 Nagios 的 check_mysql 的擴展信息

我在遠端資料庫伺服器上使用 NRPE 運行check_mysql插件,雖然我可以獲得關於伺服器是否運行的令人滿意的數據流程正在根據需要工作,我看到該插件輸出了更多資訊:

user@server:/etc/nagios# /usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -psnip
Uptime: 112398  Threads: 5  Questions: 10921804  Slow queries: 0  Opens: 4408  Flush tables: 1  Open tables: 416  Queries per second avg: 97.170|Connections=137481c;;; Open_files=0;;; Open_tables=416;;; Qcache_free_memory=1031832;;; Qcache_hits=0c;;; Qcache_inserts=0c;;; Qcache_lowmem_prunes=0c;;; Qcache_not_cached=9427651c;;; Qcache_queries_in_cache=0;;; Queries=10921805c;;; Questions=10917613c;;; Table_locks_waited=0c;;; Threads_connected=5;;; Threads_running=1;;; Uptime=112398c;;;

這讓我認為我可以斷言諸如線程數量或慢速查詢之類的事情來產生警報狀態。

問題是,我該怎麼做?此插件的-w-c參數僅處理主從時鐘漂移,而不處理其他參數。
我是否需要編寫一些自訂 shell 腳本來解析輸出然後返回自己的輸出?或者 Nagios Core 中是否有內建設施可以進行此類處理?

答案1

最後,我決定最好的做法是按照插件規範編寫一些自訂腳本,並使用awk.供日後參考(警告實施者):

#! /bin/bash

parse_mysql_output(){
    METRIC=`/usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -p[REDACTED] | grep -shoP "${METRIC_NAME}: ([\d.]+)" | awk -F ': ' '{print $2}'`
    if (($(echo "$METRIC <= $WARNING_THRESHOLD" | bc -l))); then
        echo "OK - $METRIC_NAME: $METRIC"
        exit 0
    fi

    if (($(echo "$METRIC > $WARNING_THRESHOLD" | bc -l))); then
        if (($(echo "$METRIC <= $CRITICAL_THRESHOLD" | bc -l))); then
            echo "WARNING - $METRIC_NAME: $METRIC"
            exit 1
        fi
    fi

    if (($(echo "$METRIC >= $CRITICAL_THRESHOLD" | bc -l))); then
        echo "CRITICAL - $METRIC_NAME: $METRIC"
        exit 2
    fi

    echo "INDETERMINATE STATE - $METRIC_NAME: $METRIC"
    exit 3
}

if [[ -z "$1" || -z "$2" || -z "$3" ]]
then
    echo "Missing parameters! Syntax: ./`basename $0` metric warning_threshold critical_threshold"
    exit 3
else
    METRIC_NAME=$1
    WARNING_THRESHOLD=$2
    CRITICAL_THRESHOLD=$3
fi

parse_mysql_output

在預期的用例中,您可以透過 NRPE 配置中的自訂命令呼叫它,並傳遞指標和閾值。在呼叫之前,您需要根據安裝需要更改連接。

歡迎反饋和評論。

相關內容