У меня возникла необычная проблема с выводом ps -ef
команды на AIX 7.1.
Скрипт оболочки отслеживает процессы, анализируя этот вывод. Я заметил, что в двух случаях процесс (программа Perl) был исключен из этого списка. Все, что я читал по этой теме, говорит о том, что это невозможно. Рассматриваемая программа запускается через crontab в 6 утра и работает до 11 вечера, после чего она сама завершается. Я проверил вывод ps -ef
сразу после исключения скриптом монитора, и он отображает:
user 1249864 9569338 0 06:00:00 - 0:19 /usr/bin/perl -w /path/to/omittedProgram.pl
... что означает, что это тот же самый процесс, который был запущен в 6 утра. Программа не завершилась, а затем перезапустилась.
Что стало причиной его исключения из ps -ef
вывода?
Это программа, которая проверяет вывод ps -ef
, которая успешно работает уже около пяти лет. Я заметил эту проблему только дважды, но оба раза за последние 2 месяца:
# set global variables
PROCESS_FILE=/tmp/processList.txt
TEMP_FILE=/tmp/greppedProcesses.tmp
BOX=`uname -n`
DATE=`date`
EMAIL_LIST="[email protected]"
# Get list of running processes
ps -ef > $PROCESS_FILE
checkProcess() {
PROCESS_NAME=$1
PROCESS_ABBREVIATION=$2
PROCESS_COUNT=$3
UNIQUE_PROCESS_IDENTIFIER=$4
GREPPED_LINES=$TEMP_FILE-$PROCESS_ABBREVIATION
grep $UNIQUE_PROCESS_IDENTIFIER $PROCESS_FILE | grep -v grep > $GREPPED_LINES
NUM=`cat $GREPPED_LINES | wc -l`
if [[ $NUM -ne $PROCESS_COUNT ]]
# Incorrect number of processes running!
then MESSAGE=`printf "The \"$PROCESS_NAME\" process count is %1d, but it should be $PROCESS_COUNT!!!" $NUM`
echo "Monitor - starting on $DATE\n\n$MESSAGE\n\n`cat $GREPPED_LINES`" | mail -s "Problem with $PROCESS_NAME on $BOX" $EMAIL_LIST
fi
# Delete the temp file
rm $GREPPED_LINES
}
checkProcess "Full Name of Program" "Program Abbreviation" <expected number of processes running> "Unique string to identify program in ps output"
checkProcess ... (for other processes) ...
exit 0
Кроме того, наша установка AIX не имеет pgrep
.