Ich habe ein ungewöhnliches Problem mit der Ausgabe des ps -ef
Befehls unter AIX 7.1.
Ein Shell-Skript überwacht Prozesse, indem es diese Ausgabe analysiert. Mir ist aufgefallen, dass in dieser Liste zweimal ein Prozess (ein Perl-Programm) ausgelassen wurde. Alles, was ich zu diesem Thema gelesen habe, besagt, dass dies nicht möglich ist. Das betreffende Programm startet um 6 Uhr morgens über Crontab und läuft bis 23 Uhr, wenn es sich selbst beendet. Ich habe die Ausgabe ps -ef
unmittelbar nach dem Weglassen durch das Überwachungsskript überprüft und sie zeigt Folgendes an:
user 1249864 9569338 0 06:00:00 - 0:19 /usr/bin/perl -w /path/to/omittedProgram.pl
... das heißt, es ist derselbe Prozess, der um 6 Uhr morgens gestartet wurde. Das Programm wurde nicht beendet und dann neu gestartet.
ps -ef
Was führt dazu, dass es in der Ausgabe weggelassen wird ?
Dies ist das Programm, das die Ausgabe von untersucht ps -ef
und seit etwa fünf Jahren erfolgreich läuft. Mir ist dieses Problem nur zweimal aufgefallen, aber beide Male in den letzten 2 Monaten:
# set global variables
PROCESS_FILE=/tmp/processList.txt
TEMP_FILE=/tmp/greppedProcesses.tmp
BOX=`uname -n`
DATE=`date`
EMAIL_LIST="[email protected]"
# Get list of running processes
ps -ef > $PROCESS_FILE
checkProcess() {
PROCESS_NAME=$1
PROCESS_ABBREVIATION=$2
PROCESS_COUNT=$3
UNIQUE_PROCESS_IDENTIFIER=$4
GREPPED_LINES=$TEMP_FILE-$PROCESS_ABBREVIATION
grep $UNIQUE_PROCESS_IDENTIFIER $PROCESS_FILE | grep -v grep > $GREPPED_LINES
NUM=`cat $GREPPED_LINES | wc -l`
if [[ $NUM -ne $PROCESS_COUNT ]]
# Incorrect number of processes running!
then MESSAGE=`printf "The \"$PROCESS_NAME\" process count is %1d, but it should be $PROCESS_COUNT!!!" $NUM`
echo "Monitor - starting on $DATE\n\n$MESSAGE\n\n`cat $GREPPED_LINES`" | mail -s "Problem with $PROCESS_NAME on $BOX" $EMAIL_LIST
fi
# Delete the temp file
rm $GREPPED_LINES
}
checkProcess "Full Name of Program" "Program Abbreviation" <expected number of processes running> "Unique string to identify program in ps output"
checkProcess ... (for other processes) ...
exit 0
Außerdem verfügt unsere AIX-Installation nicht über pgrep
.