
Я пытаюсь запустить базу данных Oracle, когда она выходит из строя, с помощью скрипта обработчика событий.
Файл конфигурации объекта oraclehost.cfg
имеет:
define host {
host_name Test_Oracle
address 127.0.0.1
check_command check-host-alive
check_interval 3
retry_interval 1
max_check_attempts 5
check_period 24x7
process_perf_data 0
retain_nonstatus_information 0
contacts nagiosadmin
notifications_enabled 1
notification_interval 30
notification_period 24x7
notification_options d,r
}
define service {
host_name Test_Oracle
service_description check_OraDB
check_command check_MyOracle
event_handler restart-oracle
event_handler_enabled 1
check_interval 5
retry_interval 1
max_check_attempts 5
check_period 24x7
notifications_enabled 1
notification_interval 30
notification_period 24x7
notification_options r,w,c
contacts nagiosadmin
}
Имеет commands.cfg
:
# 'Oracle DB' command definition
define command {
command_name check_MyOracle
command_line $USER1$/check_oracle_on.sh
}
# 'Oracle DB Handler' command definition
define command {
command_name restart-oracle
command_line $USER2$/oracle_handle.sh $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$
}
Вот oracle_handle.sh
скрипт, который является скриптом обработчика событий.
#!/usr/bin/sh
case "$1" in
OK)
;;
WARNING)
logger "Then it went here"
PATH=$PATH:$HOME/.local/bin:$HOME/bin:/u/oracle/server/oracle12c102/bin
export PATH
ORACLE_HOME=/u/oracle/server/oracle12c102
export ORACLE_HOME
ORACLE_SID=walinv
export ORACLE_SID
echo "ora123" |sqlplus sys@walinv as sysdba @this_file.sql
;;
UNKNOWN)
;;
CRITICAL)
;;
esac
exit 0
Внутри содержится this_file.sql
одна строка: startup
. Она используется для запуска Oracle Database.
Также logger "Then it went here"
то, что присутствует в скрипте обработчика событий, отображается в журналах Linux /var/log/messages
. Так что WARNING
дело запущено.
Мой журнал событий Nagios показывает:Скрипт журнала событий Nagios
Если я запускаю скрипт в терминале как nagios
пользователь, скрипт отлично работает и Oracle Database запускается. Однако если nagios
запустить его через веб-сервер, в Nagios Web Monitor состояние остается в предупреждении, а база данных не работает.
Пользователь nagios
находится в sudoers.
Я потратил на это больше 10 часов. Почему это происходит?
Почему Nagios не запускает мою базу данных Oracle при запуске скрипта обработчика событий?
решение1
Я заставил это работать.
Первая ошибка, которую я допустил, заключалась в том, что я не экспортировал ORACLE_HOME
and ORACLE_PATH
в свой скрипт обработчика событий.
Вторая ошибка была в этой строке:
echo "ora123" |sqlplus sys@walinv as sysdba @this_file.sql
Был this_file.sql
в \usr\local\nagios\libexec\eventhandlers
. Когда я вручную запускал скрипт из eventhandlers
папки, поэтому this_file.sql
файл был доступен. Nagios не запускает его из этой папки. Когда я указал полный путь и он заработал.